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Sequences nucleiques de polypeptides exportes de 
mycobacteries, vecteurs les comprenant et applications au 
diagnostic et a la prevention de la tuberculose. 

5 L ' invention a pour objet de nouveaux vecteurs 

recombinants de criblage, de clonage et/ou d' expression se 
repliquant chez les mycobacteries . Elle a egalement pour 
objet un ensemble de sequences codant pour des polypeptides 
exportes detectes par des fusions avec la phosphatase 

H) alcaline et dont I'expression est regulee (induite ou 
reprimee) ou constitutive lors de 1' ingestion des 
mycobacteries par les macrophages. L' invention concerne 
egalement un polypeptide, denomme DP428, d' environ 12kD 
correspondant a une proteine exportee retrouvee dans les 

15 mycobacteries appartenant au complexe de Mycobacterium 

tuberculosis. L* invention vise aussi un polynucleotide 

comprenant une sequence codant pour ce polypeptide. Elle 
concerne egalement 1 1 utilisation du polypeptide ou de 
fragments de celui-ci et des polynucleotides codant pour 

20 ces derniers (ou encore les polynucleotides complementaires 
a ces derniers) pour la realisation de moyens de detection 
in vitro, ou in vivo de la presence d'une mycobacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 
un echantillon biologique ou pour la detection de reactions 

25 de l'hote infecte par ces especes bacteriennes . L 1 invention 
vise enfin 1 ' utilisation du polypeptide ou de fragments de 
celui-ci ainsi que des polynucleotides codant pour ces 
derniers en tant que moyens destines a la preparation d'une 
composition immunogene, susceptible d'induire une reponse 

30 immunitaire dirigee contre les mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, ou d'une 
composition vaccinale pour la prevention et/ou le 
traitement d' infections provoquees par des mycobacteries 
appartenant audit complexe, en particulier la tuberculose. 

35 
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La presente invention a aussi pour but d'utiiiser ces 
sequences (polypept idiques et polynuc!6otidiques) comme 
cible pour la recherche de nouveaux inhibiteurs de la 
croisaance et de la multiplication des mycobact6ries et de 
leur maintien chez l'hote, ses inhibiteurs pouvant servir 
d • antibiotiques . 



10 Le genre Mycobacterium, qui comprend au moins 56 

especes diffSrentes, inclut des pathogenes humains majeurs 
tels gue M. leprae et M . tuberculosis , les agents 
responsables de la lepre et de la tuberculose, qui restent 
des problemes graves de sante publique dans le monde 

15 entier. 



La tuberculose continue d'etre un probleme de sante 
publique dans le monde. Aujourd'hui, cette maladie est la 
cause de 2 a 3 millions de morts dans le monde et environ 8 
20 millions de nouveaux cas sont observes chaque annee 
(Bouvet, 1994). Dans les pays developpes M. tuberculosis 
est la cause la plus commune des infections 
mycobacteriennes. En France il apparait environ 10 000 
nouveaux cas par an et parmi les maladies a declaration 
25 obligatoire c'est la tuberculose qui comprend le plus grand 
nombre de cas. La vaccination par le BCG (Bacille de 
Calmette et Guerin) , une souche avirulente derivee de M. 
bovis et qui est tres utilisee comme vaccin contre la 
tuberculose, est loin d'etre efficace au sein de toutes les 
populations. Cette efficacite varie environ de 80 % dans 
les pays occidentaux comme 1 » Angleterre , a 0 % en Inde 
(resultats du dernier essai de vaccination a Chingleput 
publies en 1972 dans Indian J. Med. Res.). De plus, 
1' apparition de souches de M. tuberculosis resistantes aux 
35 antituberculeux et le risque accru chez les patients 
immunodeprimes, patients atteints du SIDA, de developper 
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une tuberculosa, rendent necessaire la mise au point de 
methodes rapides, specifiques et fiables pour le diagnostic 
de la tuberculosa et la mise au point de nouveaux vaccins. 
Par exemple, une 6tude epidemiologique realisee en Floride, 
5 et dont les resultats ont ete publies en 1993 dans AIDS 
therapies, a montre que 10 % des malades atteints de SIDA 
sont atteints de tuberculose au moment du diagnostic du 
SIDA ou 18 mois avant celui-ci. Chez ces malades, la 
tuberculose apparait dans 60 % des cas sous une forme 
10 disseminee done non reperable par les criteres de 
diagnostic classiques comme la radiographic pulmonaire ou 
1' analyse de crachats. 



15 



Actuellement, une certitude sur le diagnostic apporte 
par la mise en evidence de bacilles cultivables dans un 
prelevement provenant du malade n'est obtenue que pour 
moins de la moitie des cas de tuberculose, meme dans les 
cas de tuberculose pulmonaire. Le diagnostic de la 
tuberculose et des autres mycobacteries apparentees est 
20 done difficile a realiser, et cela pour differentes 
raisons : les mycobacteries sont souvent presentes en 
faible quantite, leur temps de generation est tres long 
(24h pour M. tuberculosis) et leur culture est difficile. 
(Bates et al . , 1986) . 



25 



30 



35 



D' autres techniques sont utilisables en clinique, pour 
identifier une infection mycobacterienne : 

a) L' identification directe des microorganismes au 
microscope ; cette technique est rapide, mais ne permet pas 
1 ' identification de l'espece mycobacterienne observee et 
manque de sensibilite (Bates, 1979) . 

Les cultures, lorsqu'elles sont positives, ont une 
specif icite approchant 100 % et permettent 1 1 identification 
de l'espece mycobacterienne isolee ; neanmoins, comme 
precise ci-dessus, la croissance des mycobacteries in vitro 
est longue (ne peut etre realisee qu ' en 3 a 6 semaines de 
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cultures repetees (Bates, 1979 ; Bates et al . , 1986)) et 
couteuse . 

b) Les techniques s<§rologiques peuvent s'averer utiles 
dans certaines conditions, mais leur utilisation est 
parfois limitSe par leur sensibilite et/ou leur sp6cificite 
faibles (Daniel et al . , 1987). 

c) La presence de mycobacteries au sein d 1 un 
echantillon biologique peut aussi etre determinee par 
hybridation moleculaire avec de 1 1 ADN ou de l'ARN en 
utilisant des sondes d 1 oligonucleotides specifiques des 
sequences recherchees (Kiehn et al., 1987 ; Roberts et al., 
1987 ; Drake et al . , 1987). Plusieurs etudes ont montre 

15 1'interet de cette technique pour le diagnostic des 
infections a mycobacteries. Les sondes utilisees sont 
constitutes d'ADN, d'ARN ribosomique ou de fragments d * ADN 
mycobacteriens provenant de banque de genes. Le principe de 
ces techniques repose sur le polymorphisme des sequences 

20 nucleotidiques des fragments utilises ou sur le 
polymorphisme des regions avoisinantes . Dans tous les cas, 
elles necessitent 1 1 utilisation de cultures et ne sont pas 
applicables directement sur les echantillons biologiques. 



25 



30 



35 



La faible quantite de mycobacteries presentes au sein 
d'un echantillon biologique et en consequence la quantite 
faible d'ADN cible a detecter dans cet echantillon peut 
necessiter le recours a une amplification specifique in 
vitro de l'ADN cible avant sa detection a l'aide de la 
sonde nucleotidique et en utilisant des techniques 
d' amplification in vitro telles que la PCR (amplification 
en chaine a la polymerase. L ' amplification specifique de 
l'ADN par la technique PCR peut constituer la premiere 
etape d ' un precede de detection de la presence d'un ADN 
mycobacterien dans un echantillon biologique, la detection 
proprement dite de l'ADN amplifie etant effectuee dans un 
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second temps a l'aide d'une sonde ol igonucleot idique 
capable de s'hybrider specif iquement a l'ADN amplifie. 

Un test de detection de mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, par hybridation 
sandwich (test utilisant une sonde de capture et une sonde 
de detection) a £te decrit par Chevrier et al . en 1993. le 
complexe de Mycobacterium tuberculosis est un groupe de 
mycobacteries qui comprend M . bovis-BCG, M. bovis, M. 
tuberculosis , M. africanum et M. microti. 

Un procede de detection de faibles quantites de 
mycobacteries, appartenant au complexe tuberculosis, par 
amplification genique et hybridation directement sur des 
echantillons biologiques a ete mis au point. Ledit procede 
utilise la sequence d' insertion IS6110 (Brevet europeen EP 
0 490 951 Bl) . Thierry et al. ont dScrit en 1990 une 
sequence specifique du complexe Mycobacterium tuberculosis 
et nominee IS 6110. Certains auteurs ont propose 
d 'amplifier specif iquement l'ADN provenant de 
Mycobacterium en utilisant des amorces nucleiques dans une 
methode d ' amplification , telle que la reaction de 
polymerase en chaine (PCR) . Patel et al . ont decrit en 1990 
1 'utilisation de plusieurs amorces nucleiques choisies a 
partir d'une sequence connue en tant que sonde dans 
1' identification de M. tuberculosis. Cependant, la longueur 
des fragments obtenus en utilisant ces amorces etait 
differente de la longueur theorique attendue et plusieurs 
fragments de taille variable etaient obtenus. De plus, les 
auteurs ont observe 1 1 absence d ' hybridation des produits 
amplifies avec le plasmide ayant servi a determiner les 
amorces. Ces resultats indiquent que ces amorces ne 
seraient pas appropriees dans la detection de la presence 
de m. tuberculosis dans un echantillon biologique et 
confirment la nature critique du choix des amorces. La meme 
annee, J..L. Guesdon et D. Thierry ont decrit une methode de 
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detection de M. tuberculosis, de grande sensibilite, par 
amplification d ' un fragment d'ADN de M. tuberculosis 
localise au sein de la sequence IS6110 (Brevet europeen EP 
461 045) a 1 ' aide d'amorces g£n£rant des fragments d'ADN 

5 amplifi6 de longueur constante, meme lorsque le choix des 
amorces conduisait a 1 1 amplification de fragments longs {de 
l'ordre de 1000 a 1500 bases) oQ le risque d ' interrupt ion 
de la polymerisation est elevee en raison des effets de la 
structure secondaire de la sequence. D'autres amorces 

10 specifiques de la sequence IS6110 sont decrites dans le 
brevet europeen N° EP-0490 951, 

Les inventeurs ont montre (resultats non publies) que 
certains isolats cliniques de Mycobacterium tuberculosis 

15 etaient exempts de la sequence d* insertion IS6110 et ne 
pouvaient done etre d^tectes a I'aide des oligonucleotides 
specifiques de cette sequence pouvant conduire ainsi a des 
resultats de diagnostic faussement negatifs. Ces resultats 
confirment une observation similaire faite par Yuen et al. 

20 en 1993. L 1 impossibility de detecter ces souches pathogenes 
potentiellement presentes dans un echantillon biologique 
preleve sur un patient est ainsi susceptible de conduire a 
des difficultes voire des erreurs de diagnostic. La 
disponibilite de plusieurs sequences specifiques du Bacille 

25 de la tuberculose, a 1 ' interieur desquelles des amorces 
appropriees pour 1 1 amplification seront choisis, est 
importante. La sequence DP428 decrite ici pourra etre 
utilisee . 

30 M * bovis et M. tuberculosis , les agents causals de la 

tuberculose, sont des bacteries facultatives intra- 
cellulaires . 

Ces agents ont developpe des mecanismes pour assurer 
35 leur survie et leur replication a 1 ' interieur du 
macrophage, un des types cellulaires qui est suppose 
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eradiquer 1' invasion par des microorganismes . Ces agents 
sont capables de moduler 1' evolution normale de leur 
phagosome et de les empecher de se differencier en un 
compartiment acide riche en hydrolase (Clemens, 1979 ; 
5 Clemens et al . , 1996 ; Sturgil 1 - Koszycki et al., 1994 et Xu 
et al., 1994). Cependant, cette modulation n'est possible 
que si la bactSrie est vivante au sein du phagosome, 
suggdrant que des composes synthetis£s de maniere active 
et/ou secr£t6s a 1 ' interieur de la cellule font partie de 

10 ce mecanisme. Des proteines exportees sont probablement 
impliquees dans ce mecanisme. En depit des problemes 
majeurs de sante lies a ces organismes pathogenes, on sait 
peu de choses sur leurs proteines exportees et/ou 
secretees. Des analyses en SDS-PAGE de filtrat de culture 

15 de M. tuberculosis montrent au moms 30 proteines secretees 
(Altschul et al., 1990 ; Nagal et al . , 1991 et Young et 
al., 1992). Certaines d'entre elles ont ete caract^risees, 
leurs genes clones et sequences (Borremans et al . , 1989 ; 
Wiker et al . , 1992 et Yamaguchi et al., 1989). D'autres, 

20 bien qu'il s ' agisse d'antigenes immunodominants 
d- importance majeure pour induire une immunite protectrice 
(Anderson et al.,1991 et Orme et al . , 1993), ne sont pas 
totalement identifies. En outre, il est probable que de 
nombreuses proteines exportees restent fixees sur la 

25 membrane cellulaire et par consequent ne soient pas 
presentes dans les surnageants de culture. II a ete montre 
que les proteines localisees a la surface externe de 
diverses bacteries pathogenes, telles que 1 ' invasine de 103 
kDa de Yersina Pseudotuberculosis (Isberg et al . , 1987) ou 

30 l'internaline de 80 kDa de Listeria monocytogenes (Gaillard 
et al., 1991 et Dramsi et al . , 1997) jouent un role 
important dans les interactions avec les cellules hotes et 
par consequent, dans la pa t hogenicite comme dans 
l 1 induction de reponses protect rices . Ainsi, une proteine 

35 liee a la membrane pourrait etre importante pour 
1' infection a M. tuberculosis comme pour 1' induction de 
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reponse protectrice contre cette infection. Ces proteines 
pourraient revetir un interet certain pour la preparation 
de vaccins. 

• s Recemment, il a ete decrit 1' adaptation aux 

mycobact6ries d'une m£thodologie genet ique pour 
1 1 identification et la selection ph6notypique de proteines 
exportees (Lim et al . , 1995). Cette methode utilise la 
phosphatase alkaline (PhoA) periplasmique d'£. coli, Un 
It) vecteur plasmidique a ete construit permettant la fusion de 
genes entre un gene PhoA tronque et des genes codant pour 
des proteines exportees (Manoil et al . , 1990). 

Par cette methode, il a pu etre identifie un gene 
15 de M . tuberculosis (erp (Berthet et al . , 1995)) presentant 
des homologies avec une proteine exportee de 28 kDa de M . 
leprae, qui est une cible frequente des reponses humorales 
de la forme lepromateuse de la lepre. Une proteine 
presentant des motifs aminoacides caracterist iques de la 
20 desaturase de plante (des) a aussi ete caracterisee par la 
technique de fusion avec PhoA. 

Cependant, cette methode genetique d ' identification 
de proteines exportees ne permet pas d'evaluer facilement 
1' expression intracellulaire des genes correspondants . Une 
telle evaluation est d'une importance primordiale a la fois 
pour la selection de bons candidats vaccins et pour la 
comprehension des interactions entre les bacteries et leurs 
cellules notes. L' induction de 1' expression de facteur de 
virulence par contact de cellule cible pathogene a ete 
decrite. C'est le cas par exemple pour les facteurs de 
virulence Yops (Petersson et al., 1996) de Yersinia 
pseudotuberculosis . Shigella par contact avec les cellules 
cibles relargue les proteines Ipa dans le milieu de 
culture, et Salmonella synthetise de nouvelles structures 
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Compte tenu de ce qui precede, il existe aujourd'hui 
un grand besoin de developper de nouveaux vaccins contre 
les mycobactSries pathogenes ainsi que de nouveaux tests de 
diagnostic specif iques, fiables et rapides. Ces 
developpements n<§cessitent la mise au point d'outils 
specif iques encore plus performants permettant, d'une part, 
d'isoler ou d'obtenir des sequences de nouveaux 
polypeptides sp£cifiques, notamment immunogenes, et, 
d 1 autre part, de mieux comprendre le mecanisme des 
interactions entre les bacteries et leurs cellules notes 
comme notamment 1' induction de 1' expression de facteur de 
virulence . Ceci est precisement 1'objet de la presente 
15 invention. 

Les inventeurs ont defini et realise dans ce but de 
nouveaux vecteurs permettant le criblage, le clonage et/ou 
1' expression de sequences d'ADN de mycobacter ies afin 

20 d' identifier parmi ces sequences, des acides nucleiques 
codant pour des proteines d'interet, de preference des 
proteines export<§es, pouvant etre localisees sur la 
membrane bacterienne et/ou secretees, et d' identifier parmi 
ces sequences celles qui sont induites ou reprimees lors de 

25 1* infection (croissance intracellulaire) . 

Description 

La presente invention decrit 1 ' utilisation du gene 
30 rapporteur phoA chez les mycobacteries . II permet 
d'identifier des systemes d'expression et d ' exportat ion 
dans un contexte mycobacterien . Beaucoup de genes ne sont 
exprimes que dans un tel contexte, ce qui montre l'avantage 
de la presente invention. Au cours du clonage de segments 
35 d'ADN de souches du complexe M. Tuberculosis en fusion avec 
phoA dans une autre mycobacterie comme M. smegmatis, le 
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debut du gene, ses regions regulatrices et son regulateur 
seront clones ce qui permettra d'observer une regulation. 
Si cette regulation est positive, le clonage du regulateur 
constituera un avantage pour observer 1' expression et 
5 1 1 exportation . 



Dans le contexte de 1* invention, on entend par 
mycobactSrie toutes les mycobacteries appartenant aux 
diverses especes enum£rees par Wayne L. G . and Kubica G . P. 
(1980). Family Mycobacteriaceae in Bergey's manual of 
systematic bacteriology, J. P. Butler Ed. (Baltimore USA : 
Williams et Wilkins P. 1436-1457) . 



15 
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30 
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Dans certains cas les genes clones sont soumis dans 
leur hote d'origine a une regulation negative rendant 
1 'observation de 1' expression et de 1 • exportation difficile 
chez l'hote d'origine. Dans ce cas, le clonage du gene en 
absence de son regulateur negatif, dans un hote ne le 
contenant pas, constituera un avantage. 

L' invention vise aussi de nouveaux polypeptides et de 
nouveaux polynucleotides de mycobacteries ayant pu etre 
isoles au moyen des vecteurs precedents et susceptibles 
d'entrer dans la realisation de compositions pour la 
detection d'une infection par des mycobacteries, ou pour la 
protection contre une infection due a des mycobatdries ou 
pour la recherche d 1 inhibiteurs comme cela est decrit 
precedemment pour DP428. 



L ' invention a done pour objet un vecteur recombinant 
de criblage, de clonage et/ou d ' expression , caracterise en 
ce qu'il se replique chez des mycobacteries et en ce qu'il 
contient : 

1) un replicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 
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3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 

b) eventuellement un terminateur de transcription 
5 actif chez les mycobact£ries , en amont du polylinker, 

c) une sequence nucleot idique codante issue d'un gene 
codant pour un marqueur d • express ion , d • exportation et/ou 
de secretion de proteine, ladite sequence nucleot idique 
etant depourvue de son codon d' initiation et de ses 

It) sequences de regulation, et 

d) une sequence nucleot idique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus 
dans le meme fragment, ladite sequence nucleot idique etant 
pourvue de son codon d ' initiation . Eventuellement, le 
vecteur recombinant contient egalement un replicon 
fonctionnel chez E. coli. 



De maniere preferee, le marqueur d ' exportation et/ou 
de secretion est place dans la meme orientation que le 
marqueur d'activite de promoteurs. 



15 



20 



25 



Preferentiellement , le vecteur recombinant de criblage 
selon 1' invention comprendra, en outre, un terminateur de 
transcription place en aval du marqueur d'activite de 
promoteurs, ce qui est de nature a permettre l'obtention de 
transcrits courts qui se revelent plus stables et qui, par 
consequent, permettent un plus haut niveau d' expression des 
produits de traduction. 

Le marqueur d 1 exportation et/ou de secretion est une 
sequence de nucleotides dont 1' expression suivie de 
1 'exportation et/ou de la secretion depend des elements de 
regulation qui controlent son expression. 

35 Par "sequences ou elements de regulation de 

1' expression de la production de polypeptides et de sa 
localisation" , on entend une sequence promotrice de la 
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transcription, une sequence comprenant le site de liaison 
au ribosome (RBS) , les sequences responsables de 
1 ' exportation et/ou la secretion telles que la sequence 
dite sequence signal . 

5 

Un premier marqueur int<§ressant d » exportation et/ou 
d' expression est une sequence codante issue du gene phoA. 
Le cas echeant, elle est tronquee de telle facon que 
l'activite phosphatase alcaline est cependant susceptible 
10 d'etre restauree lorsque la sequence codante tronquee est 
placee sous le controle d'un promoteur et d' elements de 
regulation appropries. 

D'autres marqueurs d * exposition , d 1 exportat ion et/ou 
15 de secretion peuvent etre utilises. On citera a titre 
d'exemples une sequence du gene [3-agarase, de la nuclease 
d'un staphylocoque ou d'une P- lactamase. 



20 



Parmi les marqueurs interessants d'activite de 
promoteurs contenus dans le meme fragment, on prefere une 
sequence codante issue du gene luc de luciferase de luciole 
pourvue de son codon d ' initiation . 

D'autres marqueurs d'activite de promoteurs contenus 
25 dans le meme fragment peuvent etre utilises. On citera a 
titre d'exemples une sequence du gene de la GFP (Green 
Fluorescent Protein) . 



30 



Le terminateur de transcription doit etre fonctionnel 
chez les mycobacteries . Un terminateur avantageux est a cet 
egard le terminateur du coliphage T4 (tT4). D'autres 
terminateurs appropries pour la realisation de 1' invention 
peuvent etre isoles en utilisant la technique presentee 
dans les exemples, par exemple au moyen d'une cassette 
35 "omega" (Prentki et al . , 1984). 
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Un vecteur part icul ierement prefere pour la 
realisation de 1' invention est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM (Collection Nationale 
de Cultures de Microorganismes , 25 rue de Docteur Roux, 
5 75724 Paris cedex 15, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, le 12/12 

1996, 

b) pJVEDb depose a la CNCM sous le N° 1-1906, le 25 
10 juillet 1997, 

c) pJVEDc depose a la CNCM sous le N° 1-1799 , le 
12/12 1996. 



15 



20 
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Pour la selection, ou 1 ' identification de sequences 
d'acides nucleiques de mycobacteries codant pour des 
polypeptides susceptibles d'etre incorpores dans des 
compositions immunogenes , ou antigeniques pour la detection 
d'une infection, ou susceptibles d'induire ou de reprimer 
un facteur de virulence de mycobacteries, le vecteur de 
1' invention comprendra, en l'un des sites de clonage 
multiple du polylinker, une sequence de nucleotides d'une 
mycobacterie chez laquelle on detecte la presence de 
sequences correspondant a des polypeptides exportes et/ou 
secretes pouvant etre induits ou reprimes lors de 
1' infection, ou encore exprimes ou produits de facon 
constitutive, leurs sequences promotrices et/ou 
regulatrices associees susceptibles de permettre ou de 
favoriser 1 1 exportation et/ou la secretion desdits 
polypeptides d'interet, ou tout ou partie de genes 
d'interet codant pour lesdits polypeptides. 

De preference, cette sequence est obtenue par 
fragmentation physique ou par digestion enzymatique de 
l'ADN genomique ou de 1 ■ ADN complementaire d 1 un ARN d'une 
mycobacterie, de preference M . tuberculosis ou choisie 
parmi M. africanum, M . bovis, M. avium ou M. leprae. 
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Les vecteurs de 1' invention peuvent en effet egalemen't 
etre utilises pour determiner la presence de sequences 
d'interet, de preference correspondant a des proteines 
exportees et/ou sScretees, et/ou capables d'etre induites 
ou r6prim6es ou produites de fa<^on constitutive lors de 
1' infection, notamment lors de la phagocytose par les 
macrophages, et selon ce qui a 6t6 exposal precSdemment , 
chez des mycobact6ries telles que M . africanum, M. bovis, 
M. avium ou M. leprae dont on aura traite 1 ' ADN ou 1'ADNc 
par fragmentation physique ou avec des enzymes determinees. 

Selon un premier mode de realisation de 1' invention la 
digestion enzymatique de 1 1 ADM genomique ou de l'ADN 
complementaire est effectuee a partir de M. tuberculosis. 

De preference cet ADN est digere avec une enzyme telle 
que sau3A, BclI,BglII. 



D'autres enzymes de digestion telles que Seal, Apal, 
SacII, Kpnl ou encore des nucleases ou des polymerases, 
peuvent naturellement etre mises en oeuvre, des lors 
qu'elles permettent l'obtention de fragments dont les 
extremites peuvent etre inserees dans l'un des sites de 
clonage du polylinker du vecteur de 1' invention. 

Le cas echeant, des digestions avec differentes 
25 enzymes seront effectuees simul tanement . 

Des vecteurs recombinants preferes pour la realisation 
de 1' invention sont choisis parmi les vecteurs recombinants 
suivants deposes a la CNCM : 
30 a) P 6D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1814 , 

b) p5A3 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1815, 

c) p5F6 depose le 28 janvier 1997 a la CNCM sous le N°I- 
35 1816, 

d) p2A29 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1817 . 
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e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1818 , 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1819, 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1820, 

h) p2D7 deposd le 28 janvier 1997 a la CNCM sous le N°I- 
1821 , 

i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I- 
1843 , 

j) pJVED/M. tuberculosis depose le 25 juillet 1997 a la 

CNCM sous le N° 1-1907, 
k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n°I-2062. 

Parmi les plus preferes, on prefere le vecteur 
recombinant pDP428 depose le 28 janvier 1997 a la CNCM sous 
le N°I-1818, et le vecteur pMlC25 depose le 4 aout 1998 a 
la CNCM sous le N° 1-2062. 

L" invention a egalement pour objet un procede de 
criblage de sequences de nucleotides issues de 
mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 
pouvant etre induits ou reprimes lors de 1' infection, leurs 
sequences promotrices et/ou regulat rices associees 

susceptibles notamment de permettre ou de favoriser 
1 'exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caracterise en ce qu'il met en oeuvre 
un vecteur recombinant selon 1' invention. 

L 1 invention concerne aussi un procede de criblage, 
selon 1' invention, caracterise en ce qu'il comprend les 
etapes suivantes : 

a) la fragmentation physique des sequences d'ADN de 
mycobacteries ou leur digestion par au moins une enzyme 
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determinee et la recuperation des fragments obtenus ; 

b) 1' insertion des fragments obtenus a l'etape a) dans 
un site de clonage, compatible le cas ech6ant avec 1' enzyme 
de l'etape a), du polylinker d'un vecteur selon 
1 1 invention ; 

c) si besoin, 1 • amplification desdits fragments 
contenus dans le vecteur, par exemple par replication de ce 
dernier apres insertion du vecteur ainsi modifie dans une 
cellule determinee, de preference E coli ; 

d) la transformation des cellules botes par le vecteur 
amplifie a l'Stape c) , ou en 1 'absence d 1 amplification, par 
le vecteur de l'etape b) ; 

e) la culture des cellules notes transformees dans un 
milieu permettant la mise en evidence du marqueur 

15 d' exportation et/ou de secretion, et /ou du marqueur 
d'activite de promoteurs contenu dans le vecteur ; 

f) la detection des cellules notes positives (colonies 
positives) pour 1' expression du marqueur d ' exportation 
et/ou de secretion, et /ou du marqueur d'activite de 

20 promoteurs ; 

g) l'isolement de l'ADN des colonies positives et 
1' insertion de cet ADN dans une cellule identique a celle 
de l'etape c) ; 

h) la selection des insertions contenues dans le 
vecteur, permettant l'obtention de clones positifs pour le 
marqueur d • exportation et/ou de secretion, et /ou pour le 
marqueur d'activite de promoteurs ; 

i) l'isolement et la caracterisation des fragments 
d'ADN de mycobacteries contenues dans ces inserats. 

30 

Dans l'un des modes de realisation preferes du procede 
de criblage selon 1- invention, les cellules notes 
positives, detectees a l'etape f ) , pour le marqueur 
d' exportation et/ou de secretion sont, eventuellement dans 
35 un second temps, testees pour la capacite de 1 1 insert 
nucleotidique selectionne a stimuler 1' expression du 
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marqueur d'activite de promoteurs lorsque lesdites cellules 
hotes sont phagocytees par des cellules du type 
macrophagique . 



De maniere plus sp£cifique, on compare la stimulation 
de 1' expression du marqueur d'activite de promoteurs chez 
des cellules hotes plac£es en culture ax<§nique (cellules 
hotes seules en culture) a la stimulation de 1' expression 
du marqueur d'activite de promoteurs chez des cellules 
10 hotes cultiv<§es en presence de macrophages et ainsi 
phagocytees par ces derniers. 



La selection de cellules hotes positives pour le 
marqueur d'activite de promoteurs peut etre realisee des 
l'etape e) du procede de criblage decrit ci-dessus, ou 
encore apres 1 ' une quelconque des etapes f ) , g) , h) ou i), 
c'est-a-dire une fois que les cellules hotes ont ete 
selectionnees positivement pour le marqueur d 1 exportation 
et/ou de selection. 

La mise en oeuvre de ce procede permet la construction 
de banques d 1 ADN comportant des sequences correspondant a 
des polypeptides susceptibles d'etre exportes et/ou 
secretes, et/ou susceptibles d'etre induits ou reprimes 
lors de 1' infection lorsqu'ils sont produits au sein de 
mycobacteries recombinantes . L'dtape i) du procede peut 
comprendre une etape de sequengage des insertions 
selectionnees . 



De preference, dans le procede selon 1' invention, le 
vecteur utilise est choisi parmi les plasmides pJVEDa 
(CNCM, N° 1-1797) , p JVEDb (CNCM, N° 1-1906), pJVEDc (CNCM, 
N ° 1-1799) ou pJVED/M. tuberculosis (CNCM, N°I-1907), et la 
digestion des sequences d'ADN de mycobacteries est 
35 effectuee au moyen de 1 1 enzyme Sau3A. 



Selon un mode de realisation prefere de 1' invent! 



on , 
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le procede de criblage est caracterise en ce que les 
sequences de mycobacteries sont issues d 1 une mycobacterie 
pathogene, par exemple de M. tuberculosis, M. bovis, M. 
avium, M . africanum ou M. leprae. 

L 1 invention comprend Sgalement une banque d'ADN 
g6nomique ou d'ADNc complSmentaire d'ARNm de mycobacterie, 
caracterisee en ce qu'elle est obtenue par un procede 
comprenant les Stapes a)et b) , ou a), b) et c) du procede 
precedent selon 1* invention, de preference une banque d'ADN 
genomique ou d'ADNc complementaire d'ARNm de mycobacteries 
pathogenes, de preference de mycobacteries appartenant au 
groupe du complexe Mycobacterium tuberculosis, de 
preference de Mycobacterium tuberculosis . 

Dans la presente invention, on entend designer par 
"sequences nucleiques" ou "sequences d'acides amines" SEQ 
ID N° x a SEQ ID N° Y, ou X et Y peuvent representer 
independamment un nombre ou un caractere alphanumerique , 
respectivement 1 ' ensemble des sequences nucleiques ou 
1' ensemble des sequences d'acides amines representees par 
les figures X a Y, extremites comprises. 

Par exemple, les sequences nucleiques ou les sequences 
25 d'acides amines SEQ ID N° la SEQ ID N° 4N sont 
respectivement les sequences nucleiques ou les sequences 
d'acides amines representees par les figures 1 a 4N, c'est- 
a-dire respectivement les sequences nucleiques ou les 
sequences d'acides amines SEQ ID N° 1, SEQ ID N° 1A\ SEQ 
30 ID N° 1B\ SEQ ID N° 1C ' , SEQ ID N° ID, SEQ ID N° IF, SEQ 
ID No 2 , SEQ ID N ° 3A, SEQ ID N° 3B, SEQ ID N° 3C, SEQ ID 
N ° 4A < SE Q ID N ° 4B, SEQ ID N° 4C, SEQ ID N° 4A', SEQ ID N° 
4B\ SEQ ID N° 40, SEQ ID N° 4F, SEQ ID N° 4J, SEQ ID N° 
4K, SEQ ID N° 4L, SEQ ID N° 4M et SEQ ID N° 4N. 



20 
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L ' invention a egalement pour objet les sequences 
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nucleotidiques de mycobacteries ou comprenant des sequences 
nucleotidiques de mycobacteries selectionnees apres la 
realisation du procede selon 1' invention ci-dessus decrit. 



De preference, ladite mycobacterie est choisie parmi M. 
tuberculosis, M. bovis, M. africanum, M . avium, M. leprae, 
M. paratuberculosis , M . kansassi ou M. xenopi. 

On prefere les sequences nucleotidiques de mycobacteries 
ou comprenant une sequence nucleotidique de mycobacterie, 
ladite sequence nucleotidique de mycobacterie etant choisie 
parmi les sequences de fragments d ' ADN de mycobacterie de 
sequence nucleique SEQ ID N° la SEQ ID N° 24C, SEQ ID N° 
27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A a SEQ ID 
N° 50F, respect ivement representees par les figures 1 a 24C 
(planches 1 a 150), par les figures 27A a 27C (planches 152 
a 154), par la figure 29 (planche 156) et par les figures 
31A a 50F (planches 158 a 275) . 

Selon un mode de realisation particulier de 1' invention, 
des sequences preferees sont par exemple les fragments 
d'ADN de mycobacteries de sequence SEQ ID N°l, SEQ ID N°3A, 
SEQ ID N°5A, SEQ ID N°6A, SEQ ID N°7A, SEQ ID N°8A, SEQ ID 
N°9A, SEQ ID N°10A, SEQ ID N°27A ou SEQ ID N°29 contenus 
respectivement dans les vecteurs pDP428 (CNCM, N°I-1818) 
P6D7 (CNCM, N°I-1814), p5F6 (CNCM, N'I-1816), p2A29 (CNCNl! 
N°I-1817), p5B5 (CNCM, N'I-1819), plC7 (CNCM, N'I-1820), 
P2D7 (CNCM,N°I-1821) , plB7(CNCM, N'I-1843), P 5A3 (CNCM, 
N°I-1815) et pMlC25 (CNCM , n°I-2062). 

L ' invention concerne egalement un acide nucleique 
comprenant la totalite de la phase de lecture ouverte d ' une 
des sequences nucleotidiques selon 1' invention, notamment 
une des sequences SEQ ID N" la SEQ ID N° 24C, SEQ ID N° 
27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A a SEQ ID 
N° 50F selon 1' invention. Ledit acide nucleique peut etre 
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isole par exemple de la facon suivante : 

a) preparation d 1 une banque de cosmides a partir de l'ADN 
de M. tuberculosis, par exemple selon la technique decrite 
par Jacobs et al, , 1991; 

b) hybridation de tout ou partie d'un acide nucl6ique 
sonde de sequence choisie par exemple parmi SEQ ID N° 1 a 
SEQ ID N° 24C, SEQ ID N° 27A a SEQ ID N° 27C, SEQ ID N° 29 
et SEQ ID N° 31A a SEQ ID N° 50F avec lea cosmides de 1 
banque prealablement preparee a l'etape a) ; 

c) selection des cosmides hybridant avec 1' acide 
nucleique sonde de l'etape b) ; 

d) sequencage des inserts d ' ADN des clones selectionnes a 
l'etape c) et identification du cadre de lecture ouvert 

15 complet ; 

e) le cas echeant, clonage des inserts sequences a 
l'etape d) dans un vecteur d' expression et/ou de clonage 
approprie . 
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Les acides nucleiques comprenant la totalite du cadre de 
lecture ouvert des sequences SEQ ID N° 1 a SEQ ID N° 24C, 
SEQ ID N° 27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 
31A a SEQ ID N° 50F sont parmi les acides nucleiques 
preferes . 

La presente invention permet de determiner un fragment 
de gene codant pour un polypeptide exporte . La comparaison 
avec la sequence du genome publiee par Cole et al . (Cole et 
al., 1998, Nature, 393, 537-544) permet de determiner le 
gene en entier portant la sequence identifiee selon la 
presente invention. 



Par sequence nucleotidique comprenant la totalite du 
cadre ouvert de lecture d'une sequence selon 1' invention, 
35 on entend la sequence nucleotidique (genomique, ADNc , semi- 
synthetique ou synthetique) comprenant l'une des sequences 
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selon 1' invention et s'etendant d'une part en 5 ' de ces 
sequences jusqu'au premier codon d' initiation de la 
traduction (ATG ou GTG) ou meme jusqu'au premier codon 
stop, et d' autre part en 3 1 de ces sequences jusqu'au codon 
5 stop suivant, et ceci dans 1 ' une quelconque des trois 
phases de lecture possibles. 

Les sequences nucleotidiques complementaires des 
sequences ci-dessus selon 1 ' invention font egalement partie 
10 de 1 ' invention . 

Par polynucleotide de sequence complementaire d'une 

sequence nucleotidique selon 1' invention, on entend toute 

sequence d'ADN ou d'ARN dont les nucleotides sont 

15 complementaires de ceux de ladite sequence selon 
1' invention et dont 1 ' orientation est inversee. 

Les fragments nucleotidiques des sequences ci-dessus 
selon 1' invention notamment utiles en tant que sondes ou 
amorces font egalement partie de 1' invention. 
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L' invention concerne aussi les polynucleotides 
caracterises en ce qu'ils comprennent un polynucleotide 
choisi parmi : 

a) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide selon 1' invention, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon 1' invention, 
O un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon 
1 ' invention, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon 1' invention. 

35 Les conditions de forte stringence ainsi que le 

pourcentage d'identite seront definis ci-apres dans la 
presente description. 
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Lorsque la sequence codante issue du gene marqueur 
d' exportation et/ou de secretion est une sequence issue du 
gene phoA, 1 ' exportation et/ou la secretion du produit du 

5 gene phoA, le cas <§ch<§ant tronqud, n'est obtenue que 
lorsque cette sequence est ins6r6e en phase avec la 
sequence ou §l£ment de regulation de I 1 expression de la 
production de polynucleotides et sa localisation placee en 
amont, qui contient les Elements controlant 1 1 expression , 

0 1 'exportation et/ou la secretion issus de sequence de 
mycobact£ries . 

Les vecteurs recombinants de 1' invention peuvent bien 
entendu comprendre des sites de clonage multiples decales 
5 de un ou deux nucleotides par rapport a un vecteur selon 
1' invention, permettant ainsi d'exprimer le polypeptide 
correspondant au fragment d ' ADN de mycobacterie insere et 
susceptible d'etre traduit selon 1 1 un des trois cadres de 
lecture possibles. 



25 



Par exemple les vecteurs preferes pJVEDb et pJVEDc de 
1* invention se distinguent du vecteur prefere pJVEDa par un 
ddcalage respectif de un et de deux nucleotides au niveau 
du site de clonage multiple. 



Ainsi, les vecteurs de 1' invention sont capables 
d'exprimer chacun des polypeptides susceptibles d'etre 
codds par un fragment d'ADN de mycobacterie insere. Cesdits 
30 polypeptides, caracterises en ce qu'ils sont done 
susceptibles d'etre exportes et/ou secretes, et/ou induits 
ou reprimes, ou exprimes de fa^on constitutive lors de 
1' infection, font partie de 1* invention. 

35 On prefere notamment les polypeptides de 1' invention 

dont les sequences d'acides amines sont choisies parmi les 
sequences d'acides amines SEQ ID N° 1 a SEQ ID N° 24C, SEQ 
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ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 50F et 
representees respect ivement par les figures 1 a 24C 
(planches 1 a 150), les figures 27A a 28 (planches 152 a 
155) et les figures 30 a 50F (planches 157 a 275) . 

5 

Font 6galement partie de 1* invention, les fragments ou 
fragments biologiquement actifs ainsi que les polypeptides 
homologues desdits polypeptides. Fragment, fragment 
biologiquement actif et polypeptides homologue de 
10 polypeptide, etant tels que definis ci-apres dans la 
description . 



L 1 invention concerne egalement les polypeptides 
comprenant un polypeptide ou un de leurs fragments selon 
15 1 ' invention . 



L' invention a aussi pour objet des mycobacteries 
recombinantes contenant un vecteur recombinant selon 
1' invention decrit precedemment . Une mycobacterie preferee 
20 est une mycobacterie du type M . stneqmatis . 

M. smeqmatis permet avantageusement de tester 
l'efficacite de sequences de mycobacteries, pour le 
controle de 1 1 expression , de 1 ' exportation et/ou de la 
secretion, et/ou de l'activite de promoteurs d ' une sequence 
25 donnee, par exemple d'une sequence codant pour un marqueur 
tel que la phosphatase alcaline et/ou la luciferase. 



Une autre mycobacterie preferee est une mycobacterie du 
type AT. bovis, par exemple la souche BCG utilisee 
30 actuellement pour la vaccination contre la tuberculose. 

Une autre mycobacterie preferee est une souche de M. 
tuberculosis, M. bovis ou M . africanum possedant 
potentiellement tous les systemes de regulation appropries. 

35 Les inventeurs ont ainsi caracterise en particulier un 

polynucleotide constitue par une sequence de nucleotides 
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presente chez toutes les souches testees de mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis. Ce 
polynucleotide, denomme DP428 contient un cadre ouvert de 
lecture (ORF) codant pour un polypeptide d'environ 12 kD. 
5 Le cadre de lecture ouvert (ORF) codant pour le polypeptide 
DP428 s'6tend du nucleotide en position nt 941 au 
nucleotide en position nt 1351 de la sequence SEQ ID N° 2, 
le polypeptide DP428 ayant la sequence en acides amines SEQ 
ID N° 28 suivante : 

10 MKTGTATTRRRLLAVLIALALPGAAVALLAEPSATGASDPCAASEVARTVGSVAKSMGD 

YLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPKVASDLHALSQPLTDLSTRCSLP 
ISGLQAIGLMQAVQGARR . 



Ce poids moleculaire (PM) correspond au PM theorique de 
la proteine mature obtenue apres clivage de la sequence 
signale, le PM de la proteine ou polypeptide DP428 etant 
d'environ 10 kD apres ancrage potentiel au pept idoglycane 
et coupure potentielle entre S et G du motif LPISG. 



20 Ce polynucleotide inclut, d ' une part, un cadre ouvert de 

lecture correspondant a un gene de structure et, d' autre 
part, les signaux de regulation de 1' expression de la 
sequence codante en amont et en aval de cette derniere.Le 
polypeptide DP428 est compose d'un peptide signal, d'une 
region centrale hydrophile et d'une region C-terminale 
hydrophobe. Cette derniere se termine par deux residus 
arginines (R), signal de retention, et est precede par un 
motif LPISG qui rappelle le motif LPXTG d' ancrage au 
peptidoglycane (Schneewind et al . , 1995). 



25 



30 



un 



Par gene de structure aux fins de la presente invention, 
on entend un polynucleotide codant pour une proteine, 
polypeptide ou encore un fragment de ces derniers, ledit 
polynucleotide ne comprenant que la sequence correspondant 
35 au cadre ouvert de lecture (ORF) , ce qui exclut les 
sequences du cote 5' du cadre ouvert de lecture (ORF) qui 
dirigent 1* initiation de la transcription. 
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35 



Ainsi, l f invention concerne en particulier 
polynucleotide dont la sequence est choisie parmi les 
sequences nucl6ot idiques SEQ ID N°l a SEQ ID N°2. 



Plus particulierement , 1' invention concerne 
polynucleotide caract£ris£ en ce qu'il comprend 
polynucleotide choisi parmi : 



un 
un 



10 a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucleot idiques SEQ ID N°l a SEQ ID N°2, 

b) un polynucleotide dont la sequence nucleique est la 
sequence comprise entre le nucleotide en position nt 964 
et le nucleotide en position nt 1234, extremites indues, 

15 de la sequence SEQ ID N°l, 

c) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) , c) ou d) , 

f) un fragment d 1 au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) . 



On entend par sequence nucleot idique , polynucleotide 
ou acide nucleique, selon la prdsente invention, aussi bien 
un ADN double brin, un ADN simple brin que des produits de 
transcription desdits ADN. 

Par pourcentage d'identite au sens de la presente 
invention, on entend un pourcentage d'identite entre les 
bases de deux polynucleotides, ce pourcentage etant 
purement statistique et les differences entre les deux 
polynucleotides etant reparties au hasard et sur toute 
leur longueur. 
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Une hybridation dans des conditions de forte 
stringence signifie que les conditions de temperature et de 
force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de 1 ' hybridation entre deux 
fragments d'ADN complementaires . 



A titre illustratif, des conditions de forte 
stringence de l'etape d * hybridation aux fins de d£finir les 
fragments polynucleot idiques decrits ci-dessus, sont 

10 avantageusement les suivantes : 

1 ' hybridation est realisee a une temperature 
pref erentielle de 65°C, en presence de tampon commercialise 
sous le nom de rapid-hyb buffer par Amersham {RPN 1636) et 
100 /ig/ml d'ADN de E.coli. 

15 L es etapes de lavage peuvent, par exemple, etre les 

suivantes : 

- deux lavages de 10 min, pref erent iellement a 65°C / dans 
un tampon 2 x SSC et 0,1% SDS; 

- deux lavages de 10 min, pref erent iellement a 65°C, dans 
20 un tampon 1 x SSC et 0,1% SDS; 

- un lavage de 10 min, pref erent iellement a 65°C, dans un 
tampon de 0 , 1 x SSC et 0,1% SDS. 

1 x SSC correspond a 0,15 M NaCl et 0,05M citrate de 
Na et une solution de 1 x Denhardt correspond a 0,02% 
25 Ficoll, 0,02% de polyvinylpyrrolidone et 0,02% de serum 
albumine bovine. 



30 



35 



Avantageusement, un fragment nucleot idique repondant a 
la definition prec£dente aura au moins 8 nucleotides, de 
preference au moins 12 nucleotides, et encore plus 
preferentiellement au moins 20 nucleotides consecutifs de 
lasequence dont il est issu. Les conditions d 1 hybridation 
de forte stringence decrites ci-avant pour un 
polynucleotide d'une taille d' environ 200 bases, seront 
adaptees par 1 ' homme du metier pour des oligonucleotides de 
taille plus grande ou plus petite, selon 1 1 enseignement de 
Sambrook et al . , 1989. 
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Pour les conditions de mise en oeuvre des enzymes de 
restriction dans le but d'obtenir des fragments 
nucl^otidiques des polynucleotides selon 1' invention, on se 
r£ferera avantageusement a l'ouvrage de Sambrook et al . , 
1989 . 



Avantageusement, un polynucleotide de 1' invention 
contiendra au moins une sequence comprenant 1 1 enchalnement 
10 de nucleotides allant du nucleotide en position nt 964 au 
nucleotide nt 1234 du polynucleotide de sequence SEQ ID 
N° 1. 



20 



La presente invention a pour objet un polynucleotide 
selon 1' invention, caracterise en ce que sa sequence 
nucleique hybride avec 1 1 ADN de sequence de mycobacteries 
et pref erentiellement avec 1 * ADN de sequence de 
mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis . 

Le polynucleotide est code par une sequence 
polynucleotidique telle que decrite supra. 



La presente invention a egalement pour objet un 
polypeptide issu d 1 une mycobacter ie , caracterise en ce 
qu'il est present uniquement chez les mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis . 



L' invention concerne egalement un polypeptide 
30 caracterise en ce qu'il comprend un polypeptide choisi 
parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d'acides amines SEQ ID N°l a SEQ ID N°24C, 

35 SEQ ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide defini en a) , 
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c) un fragment d 1 au tnoins 5 acides amines d 1 un polypeptide 
def ini en a) ou b) , 

d) un fragment biologiquement actif d'un polypeptide defini 
en a) , b) , ou c) . 

5 

La pr6sente invention a aussi pour objet un 
polypeptide done la sequence d' acides amines est comprise 
dans la sequence d' acides amines SEQ ID N°l ou SEQ ID N°2, 
ou un polypeptide de sequence d' acides amines SEQ ID N°28. 

K) 

Par polypeptide homologue, on entendra designer les 
polypeptides presentant, par rapport au polypeptide naturel 
selon 1' invention tel que le polypeptide DP428, certaines 
modifications comme en particulier une deletion, addition 

15 ou substitution d 1 au mo ins un acide amin<§, une troncation, 
un allongement, une fusion chim£rique, et/ou une mutation. 
Parmi les polypeptides homologues, on prefere ceux dont la 
sequence d 1 acides amines presente au moins 30%, de 
preference 50%, d'homologie avec les sequences d' acides 

2t) amines des polypeptides selon 1' invention. Dans le cas 
d'une substitution, un ou plusieurs acides amines 
consecutifs ou non consecutifs, sont remplaces par des 
acides amines « equivalents ». L 1 expression acide amine 
<c equivalent » vise ici a designer tout acide amine 

25 susceptible d'etre substitue a 1 1 un des acides amines de la 
structure de base sans cependant modifier essent iellement 
les propri<§tes immunogenes des peptides correspondants . En 
d'autres termes, les acides amines equivalents seront ceux 
qui permettent l'obtention d'un polypeptide de sequence 

30 modifiee qui permet 1' induct ion in vivo d'anticorps ou de 
cellules capables de reconnaitre le polypeptide dont la 
sequence d' acides amines est comprise dans la sequence 
d 1 acides amines de polypeptide selon 1' invention, telle que 
les sequences d' acides amines SEQ ID N°l a SEQ ID N° 2, ou 
35 un polypeptide de sequence d' acides amines SEQ ID N°28 
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(polypeptide DP428) ou 1 1 un de ses fragments ci-dessus 
def inis . 

Ces aminoacyles equivalents peuvent etre determines 
soit en s ' appuyant sur leur homologie de structure avec les 
5 aminoacyles auxquels ils se substituent, soit sur les 
resultats des essais d 1 immunog£nici te crois6e auxquels les 
differents peptides sont susceptibles de donner lieu. 

A titre d'exemple, on mentionnera les possibilites de 
10 substitutions susceptibles d'etre effectuees sans qu'il en 
r£sulte une modification approfondie de 1 ' immunogenicite 
des peptides modifies correspondants , les remplacement s , 
par exemple, de la leucine par la valine ou 1 1 isoleucine , 
de l'acide aspartique par l'acide glutamique, de la 
15 glutamine par 1 * asparagine , de l'arginine par la lysine 
etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

Par fragment biologiquement actif, on entendra 
20 designer en particulier un fragment de sequence d'acides 
amines de polypeptide presentant au moins une des 
caracteristiques des polypeptides selon 1' invention, 
notamment en ce qu'il est ; 

capable d'etre exporte et/ou secrete par une 
25 mycobacterie, et/ou d'etre induit ou reprime lors de 
1' infection par la mycobacterie ; et/ou 

capable d'induire, de reprimer ou de moduler, 
directement ou indirectement , un facteur de virulence de 
mycobacterie ; et/ou 
30 - capable d'induire une reaction d ' immunogenicite dirigee 
contre les mycobacteries ; et/ou 

- capable d'etre reconnu par un anticorps specif ique de 
mycobacterie . 

35 Par fragment de polypeptide, on entend designer un 

polypeptide comportant au minimun 5 acides amines, de 
preference 10 acides amines et 15 acides amines. 
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Un polypeptide de 1' invention, ou un de ses 

fragments, tels que definis precedemment , est susceptible 
d'etre reconnu specif iquement par les anticorps presents 
5 dans le s6rum de patients infect<§s par des mycobact£ries et 
pr6f erentiellement des bact<§ries appartenant au complexe de 
Mycobacterium tuberculosis ou par des cellules de 1 ' bote 
inf ect6 . 

Font ainsi partie de 1' invention les fragments du 
0 polypeptide dont la sequence d'acides amines est comprise 
dans la sequence d'acides amines de polypeptide selon 
1' invention, telle que les sequences d'acides amines SEQ ID 
N°l a SEQ ID N°2, ou un polypeptide de sequence d'acides 
amines SEQ ID N°28, qui peuvent etre obtenus par clivage 
5 dudit polypeptide par une enzyme proteolyt ique , telle que 
la trypsine ou la chymotrypsine ou la collag6nase, ou par 
un reactif chimique, tel que le bromure de cyanogene (CNBr) 
ou encore en plac^ant un polypeptide selon 1' invention tel 
que le polypeptide DP428 dans un environnement tres acide, 
U) par exemple a pH 2,5. Des fragments peptidiques preferes 
selon 1* invention, pour une utilisation en diagnostic ou en 
vaccination, sont les fragments contenus dans des regions 
de polypeptide selon 1' invention tel que le polypeptide 
DP428 susceptibles d'etre naturellement exposees au solvant 
et de presenter ainsi des propriStes d ' immunogenicite 
importante. De tels fragments peptidiques peuvent etre 
prepares indif f £remment par synthese chimique, a partir 
d'hotes transformes par un vecteur d' expression selon 
1* invention contenant un acide nucleique permettant 
30 1' expression desdits fragments, place sous le controle des 
elements de regulation et/ou d' expression appropries ou 
encore par clivage chimique ou enzymatique. 

Une analyse de 1 ' hydrophil icite du polypeptide DP428 a 
35 ete realisee a 1 ' aide du logiciel DNA Strider™ 
(commercialise par le CEA Saclay) , sur la base d'un calcul 
du caractere hydrophile de la region codante pour le DP428 
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de la SEQ ID N°28. Les resultats de cette analyse sont 
presentes a la figure 54, ou sont detailles, pour chacun 
des acides amines (AA) de position definie dans la SEQ ID 
N°28, 1 ' indice d ■ hydrophil icite . Plus 1 ' indice 

5 d' hydrophilicite" est Sieve, plus l'acide amine" considere 
est susceptible d'etre expose au solvant dans la molecule 
native, et est en consequence susceptible de presenter un 
degr£ d ■ ant igenicite eleve. Ainsi, un enchainement d ■ au 
moins sept acides amines possedant un indice eleve 
10 d' hydrophilicite (>0 # 3) peut constituer la base de la 
structure d 1 un peptide candidat immunogene selon la 
presente invention . 

Les reponses immunitaires cellulaires de 1 1 hote a un 
15 polypeptide selon 1' invention, peuvent etre mises en 
evidence selon les techniques decntes par Colignon et al . , 
1996 . 

D'apres les donnees de la carte d ' hydrophil icite 
20 presentee a la Figure 54, les inventeurs ont pu definir des 
regions du polypeptide DP428 pref erent iel lement exposees au 
solvant, plus particulierement la region localisee entre 
les acides amines 55 et 72 de la sequence SEQ ID N° 28 et 
la region localisee entre les acides amines 99 et 107 de la 
25 SEQ ID N° 28 . 

Les regions peptidiques du polypeptide DP428 definies 
ci-dessus peuvent etre avantageusement mises en oeuvre pour 
la realisation des compositions immunogenes ou des 
30 compositions vaccinales selon 1* invention. 

Les polynucleotides caracterises en ce qu'ils codent 
pour un polypeptide selon 1' invention, font egalement 
partie de 1' invention. 

35 

L ' invention concerne egalement les sequences d'acide 
nucleique utilisables comme sonde ou amorce, caracterisees 
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en ce que lesdites sequences sont choisies parmi les 
sequences d'acide nucleique de polynucleotides selon 
1 ' invention . 

5 L'invention concerne en outre 1 1 utilisation d'une 

sequence d'acide nucleique de polynucleotides selon 
1' invention comme sonde ou amorce, pour la detection et/ou 
1 1 amplification de sequence d'acide nucleique. Parmi ces 
sequences d'acide nucleique selon 1' invention utilisables 

10 comme sonde ou amorce, on prefere les sequences d'acide 
nucleique de 1' invention, caracterisee en ce que lesdites 
sequences sont des sequences, ou leur sequence 
complementaire, comprises entre le nucleotide en position 
nt 964 et le nucleotide en position nt 1234, extremites 

15 indues, de la sequence SEQ ID N°l. 

Parmi les polynucleotides selon 1' invention, 
utilisables comme amorces nucleot idiques , on prefere 
particulierement les polynucleotides de sequence SEQ ID 
20 N°25 et SEQ ID N°26. 

Les polynucleotides selon l 1 invention peuvent ainsi 
etre utilises pour selectionner des amorces nucleot idiques , 
notamment pour la technique PCR (Erlich, 1989 ; Innis et 
25 al., 1990, et, Rolfs et al . , 1991). 

Cette technique necessite le choix de paires 
d ' oligonucleotides encadrant le fragment qui doit etre 
amplifie. On peut , par exemple, se referer a la technique 

30 decrite dans le brevet americain U.S. N° 4 683 202. Ces 
amorces oligodesoxyribonucleot idiques ou oligoribo- 
nucleotidiques ont avantageusement une longueur d'au moins 
8 nucleotides, de preference d'au moins 12 nucleotides, et 
encore plus pref erent iellement au moins 20 nucleotides. On 

35 preferera en particulier des amorces d'une longueur 
comprise entre 8 et 30 et de preference 12 et 22 
nucleotides. L'une des deux amorces est complementaires du 
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brin (+) [amorce aller] de la matrice et 1' autre amorce est 
complementaire du brin (-) [amorce retour] . II est 
important que les amorces ne possedent pas de structure 
secondaire ou de sequence complementaire 1 ' une de 1' autre. 

5 D' autre part, la longueur et la sequence de chaque amorce 
doivent etre choisies de maniere a ce que les amorces ne 
s'hybrident pas avec d'autres acides nucl£iques provenant 
de cellules procaryotes ou eucaryotes, en particulier avec 
les acides nucleiques provenant d'autres mycobacteries 

0 pathogenes, ni avec I'ADN ou 1 • ARN humain pouvant 
eventuellement contaminer 1 ' echant illon biologique. 

Les resultats presentes a la figure 51, montrent que 
la sequence codant pour le polypeptide DP428 (SEQ ID N° 28) 
5 n'est pas retrouvee dans les ADNs de M. fortuitum, M . 
simiae, M . avium, M. cheionae, M. flavescens , M. gordonae, 
M. warinum et M. kansasii 



Les fragments amplifies peuvent etre identifies apres 
20 une electrophorese en gel d' agarose ou de polyacrylamide , 
ou apres une electrophorese capillaire, ou encore apres une 
technique chromatographique (filtration sur gel, 
chromatographic hydrophobe ou chromatographie echangeuse 
d'ions). La specificite de 1 ' amplification peut etre 
25 controlee par hybridation moleculaire en utilisant comme 
sondes les sequences nucleot idiques de polynucleotides de 
1' invention, des plasmides contenant ces sequences ou leurs 
produits d ' amplification . 

30 Les fragments nucleot idiques amplifies peuvent etre 

utilises comme reactifs dans des reactions d ' hybridation 
afin de mettre en evidence la presence, dans un echantillon 
biologique, d ' un acide nucleique cible de sequence 
complementaire a celle desdits fragments nucleot idiques 

35 amplifies. 
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Parmi les polynucleotides selon 1' invention, 
utilisables comme sondes nucleot idiques , on prefere tout 
particulierement le fragment polynucl£ot idique comprenant 
la sequence comprise entre le nucleotide en position nt 964 
et le nucl6otide en position nt 1234, extr<§mites indues, 
de la sequence de SEQ ID N°l. 



Ces sondes et ampl icons peuvent etre marqu6s ou non 
par des Elements radioactifs ou par des molecules non 
radioactives , telles que des enzymes ou des elements 
f luorescents . . 



L' invention vise egalement les fragments 

nucleotidiques susceptibles d'etre obtenus par 

amplification a l'aide d'amorces selon 1' invention. 

D'autres techniques d ' amplification de l'acide 
nucleique cible peuvent etre avantageusement employees 
comme alternatives a la PGR. 



20 La technique SDA (Strand Displacement Amplification) 

ou technique d 1 amplification a deplacement de brin (Walker 
et al., 1992) est une technique d 1 amplification isotherme 
dont le principe est fonde sur la capacite d 1 une enzyme de 
restriction de couper 1 ' un des deux brins de son site de 

25 reconnaissance qui se trouve sous une forme 
hemiphosphorothioate et sur la propri6te d'une ADN 
polymerase d'initier la synthese d'un nouveau brin d ' ADN a 
partir de l'extremite 3' OH creee par 1* enzyme de 
restriction et de deplacer le brin prealablement synthetise 

30 qui se trouve en aval. 

Les polynucleotides de 1' invention, en particulier les 
amorces selon 1' invention, peuvent egalement etre mis en 
oeuvre dans d'autres procedes d 1 amplification d'un acide 
nucleique cible, tels que : 

35 - la technique TAS (Transcription-based Amplification 
System), decrite par Kwoh et al . en 1989; 
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- la technique 3SR (Sel f -Sustained Sequence Replication) , 
decrite par Guatelli et al . en 1990; 

la technique NASBA (Nucleic Acid Sequence Based 
Amplification), decrite par Kievitis et al. en 1991; 
5 - la technique TMA (Transcription Mediated Amplification) . 

Les polynucleotides de 1' invention peuvent aussi etre 
employes dans des techniques d 'amplification ou de 
modification de I'acide nucleique servant de sonde, telles 
que : 

10 - la technique LCR (Ligase Chain Reaction) , decrite par 
Landegren et al . en 1988 et per feet ionnee par Barany et al . 
en 1991, qui emploie une ligase thermostable; 

- la technique de RCR (Repair Chain Reaction) , decrite par 
Segev en 1992 ; 

15 - la technique CPR (Cycling Probe Reaction) , decrite par 
Duck et al . en 1990; 

la technique d 1 ampl if icat ion a la Q-beta - repl icase , 
decrite par Miele et al. en 1983 et per feet ionnee notamment 
par Chu et al. en 1986, Lizardi et al . en 1988, puis par 

20 Burg et al . ainsi que par Stone et al . en 1996. 

Dans le cas oil le polynucleotide cible a detecter est 
un ARN, par exemple un ARNm , on utilisera avantageusement , 
prealablement a la mise en oeuvre d 1 une reaction 

25 d ' amplification a l'aide des amorces selon 1 1 invention ou a 
la mise en oeuvre d'un procede de detection a l'aide des 
sondes de 1" invention, une enzyme de type transcriptase 
inverse afin d'obtenir un ADNc a partir de 1 ' ARN contenu 
dans 1 ' echantillon biologique. L ' ADNc obtenu servira alors 

30 de cible pour les amorces ou les sondes mises en oeuvre 
dans le procede d ' amplification ou de detection selon 
1 ' invention . 

La sonde de detection sera choisie de telle maniere a 
35 ce qu'elle hybride avec 1' ampl icon genere. Une telle sonde 
de detection aura avantageusement pour sequence une 
sequence d 1 au moins 12 nucleotides, en particulier d'au 
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moins 15 nucleotides, et de preference au moins de 200 
nucleotides . 

Les sondes nucleot idiques selon 1 1 invention sont 
capables de d£tecter des mycobacteries et 

preferentiellement des bact£ries appartenant au complexe de 
Mycobacterium tuberculosis, plus pr£cisement du fait que 
ces mycobacteries possedent dans leur genome au moins une 
copie de polynucleotides selon 1' invention. Ces sondes 
selon 1' invention, sont capables, par exemple, de 
s'hybrider avec la sequence nucleot idique d ' un polypeptide 
selon l 1 invention, plus part icul ierement tout 

oligonucleotide hybridant avec la sequence SEQ ID N°l 
codant pour le polypeptide DP428 de M . tuberculosis, et ne 
presentant pas de reaction d 1 hybridat ion croisee ou 
d' amplification (PCR) avec par exemple des sequences 
presentes chez des mycobacteries n 1 appartenant pas au 
complexe de Mycobacterium tuberculosis . Les sondes 
nucleotidiques selon 1' invention hybrident specif iquement 
avec une molecule d'ADN ou d'ARN de polynucleotide selon 
1' invention, dans des conditions d ' hybridat ion de forte 
stringence telles que donnees sous forme d' exemple 
precedemment . 

Les sequences non marquees peuvent etre utilisees 
directement comme sondes, cependant les sequences sont 
generalement marquees par un element radioactif ( 32 P, )s s, 
3 H, 125 I) ou par une molecule non- radioactive (biotine, 
acetylaminof luorene , digoxigenine , 5 -bromo-desoxyuridine , 
f luoresceine) pour obtenir des sondes utilisables pour de 
nombreuses applications. 

Des exemples de marquages non radioactifs de sondes 
sont decrits, par exemple, dans le brevet frangais N° 
78.10975 ou par Urdea et al . ou par Sanchez - Pescador et al . 
5 en 1988. 
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Dans ce dernier cas, on pourra aussi utiliser 1 ' une 
des methodes de marquage decrites dans les brevets FR 2 422 
956 et FR 2 518 755. La technique d ' hybrida t ion peut etre 
r<§alis£e de manieres diverses (Matthews et al . , 1988). La 
5 m§thode la plus g£n£rale consiste a immobiliser l'acide 
nucleique extrait des cellules de mycobact£ries sur un 
support (tel que nitrocellulose, nylon, polystyrene) et a 
incuber, dans des conditions bien definies, l'acide 
nucleique cible immobilise avec la sonde. Apres 
10 1 ■ hybridation, 1 1 exces de sonde est elimine et les 
molecules hybrides formees sont detectees par la methode 
appropriee (mesure de la radioact ivite , de la fluorescence 
ou de l'activite enzymatique liee a la sonde). 



5 
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Avantageusement , les sondes nucleot idiques marquees 
selon 1' invention peuvent avoir une structure telle 
qu'elles rendent possible une amplification du signal 
radioactif ou non-radioact if . Un systeme d ' amplification 
repondant a la definition ci-dessus comprendra des sondes 
de detection sous la forme d'un ADN ramifie, branche 
(«branched DNA») telles que celles decrites par Urdea et 
al. en 1991. Selon cette technique, on utilisera avanta- 
geusement plusieurs types de sondes notamment une sonde de 
capture, afin d ' immobiliser 1 1 ADN ou l'ARN cible sur un 
support, et une sonde de detection. La sonde de detection 
lie un ADN «branch€» presentant une structure ramifiee. 
L'ADN branche, a son tour, est capable de fixer des sondes 
oligonucleotidiques qui sont elles-memes couplees a des 
molecules de phosphatase alcaline. Puis l'activite de cette 
enzyme est mise en evidence grace a un substrat chimio- 
luminescent, par exemple un derive du dioxetane-phosphate . 

Selon un autre mode avantageux de mise en oeuvre des 
sondes nucleiques selon 1' invention, ces dernieres peuvent 
etre immobilisees sur un support, de maniere covalente ou 
non covalente, et utilisees comme sondes de capture. Dans 
ce cas, une sonde, dite «sonde de capture», est immobilisee 
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sur un support et sert a capturer par hybridation speci- 
fique l'acide nucleique cible obtenu a partir de l'echan- 
tillon biologique a tester. Si necessaire, le support 
solide est s6pare de 1 ' echant illon et le duplex forme entre 
5 la sonde de capture et l'acide nucleique cible est ensuite 
detecte grace a une seconde sonde, dite «sonde de 
detection*, marquee par un Element facilement detectable. 

Les fragments oligonucleotidiques peuvent etre obtenus 
K) a partir des sequences selon 1' invention, par coupure avec 
des enzymes de restriction, ou par synthese chimique selon 
les methodes classiques, par exemple selon la methode 
decrite dans le brevet europeen N° EP-0305929 (Millipore 
Corporation) ou encore par d'autres procedes. 
15 Un mode de preparation approprie des acides nucleiques 

de 1* invention comportant au maximum 200 nucleotides (ou 
200 pb s'il s'agit d'acides nucleiques bicatenaires) 
comprend les etapes suivantes : 

- la synthese d'ADN en utilisant la methode automatisee des 
20 beta-cyanethylphosphoramidite decrite en 1986, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 
par hybridation avec une sonde appropriee. 

Un mode de preparation, par voie chimique, d'acides 
25 nucleiques selon 1' invention de longueur superieure a 200 
nucleotides (ou 200 pb lorsqu'il s'agit d'acides nucleiques 
bicatenaires) comprend les etapes suivantes : 

- 1' assemblage d • oligonucleotides synthetises chimiquement , 
pourvus a leur extremite de sites de restrictions 

30 differents, dont les sequences sont compatibles avec 
1 ' enchainement en acides amines du polypeptide naturel 
selon le principe decrit en 1983, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 

35 recherches par hybridation avec une sonde appropriee. 
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Les sondes nucleot idiques utilisees pour la 
recuperation des acides nucleiques recherches dans les 
procedes sus-ment ionnes , sont constitutes generalement de 8 
a 200 nucleotides de la sequence de polypeptide selon 
1' invention et sont susceptibles de s'hybrider avec i'acide 
nucl<§ique recherche dans les conditions d ' hybridation 
definies prec£demment . La synthese de ces sondes peut etre 
effectu^e selon la m6thode automat isee des beta 
cyanethylphosphoramidites decrite en 1986. 



Les sondes oligonucleot idiques selon I 1 invention 
peuvent etre mises en oeuvre au sein d'un dispositif de 
detection comprenant une banque matricielle 

d' oligonucleotides . Un exemple de realisation d'une telle 
15 banque matricielle peut consister en une matrice 
d' oligonucleotides sondes fixes sur un support, la sequence 
de chaque sonde d'une longueur donnee etant situee en 
decalage d'une ou plusieurs bases par rapport a la sonde 
precedente, chacune des sondes de 1 1 arrangement matriciel 
etant ainsi complementaire d'une sequence distincte de 
l'ADN ou l'ARN cible a detecter et chaque sonde de sequence 
connue etant fixee en une position predeterminee du 
support. La sequence cible a detecter peut etre 
avantageusement marquee radioact ivement ou non 
25 radioactivement . Lorsque la sequence cible marquee est mise 
en contact avec le dispositif matriciel, celle-ci forme des 
hybrides avec les sondes de sequences complementaires . Un 
traitement a la nuclease, suivi d'un lavage, permet 
d'eliminer les hybrides sondes-sequence cible qui ne sont 
30 pas parfaitement complementaires. Du fait de la 
connaissance precise de la sequence d'une sonde a une 
position determinee de la matrice, il est alors possible de 
deduire la sequence nucleotidique de la sequence d'ADN ou 
d'ARN cible. Cette technique est part icul ierement efficace 
35 lorsque sont utilisees des matrices de sondes 
oligonucleotidiques de grande taille. 
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Une alternative a 1 1 utilisation d'une sequence cible 
marquee peut consister en 1 ' ut i 1 isat ion d • un support 
permettant une detection « bioelectronique » de 
1 ' hybridation de la sequence cible sur les sondes du 
support matrice, lorsque que ledit support est constitu6 ou 
comprend un mat£riau capable d'agir, par exemple, en tant 
que donneur d»£lectrons aux positions de la matrice 
auxquelles un hybride a et<§ forme. Un tel materiau donneur 
d'electron est par exemple de l'or. La detection de la 
sequence nucleot idique de 1 ' ADN ou ARN cible est alors 
determinee par un dispositif elect ronique . 

Un exemple de realisation d'un biocapteur, tel que 
defini ci-dessus, est decrit dans la demande de brevet 
europeen N° EP-0721 016 au nom de Affymax technologies N.V. 
ou encore dans le brevet americain N° US 5.202.231 au nom 
de Drmanac . 

L- invention a aussi pour objet les polynucleotides 
hybrides resultant : 

- soit de la formation d'une molecule hybride entre un ARN 
ou un ADN (ADN genomique ou ADNc) provenant d'un 
echantillon biologique avec une sonde ou une amorce selon 
1 ' invention . 

- soit de la formation d'une molecule hybride entre un ARN 
25 ou un ADN (ADN genomique ou ADNc) provenant d'un 

echantillon biologique avec un fragment nucleot idique 
amplifie a l'aide d'un couple d' amorces selon l 1 invention. 

Par ADNc au sens de la presente invention, on entend 
une molecule d 1 ADN obtenue en faisant agir une enzyme de 
type transcriptase inverse sur une molecule d ' ARN , en 
particulier une molecule d'ARN messager (ARNm) , selon les 
techniques decites dans Sambrook et al . en 1989. 

La presente invention a egalement pour objet une 
famille de plasmides recombinants, caracterises en ce 
qu'ils contiennent au moms une sequence nucleot idique de 
polynucleotide selon 1' invention. Selon un mode de 
realisation avantageux dudit plasmide, il comprend la 
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sequence nucleot idique SEQ ID N°l ou un fragment de celle- 
ci . 

Un autre objet de la presente invention est un vecteur 
pour le clonage , 1 ■ expression et/ou I 1 insertion d'une 
5 s6quence, caract£ris6 en ce qu'il comprend une sequence 
nuclSotidique de polynucleotide selon 1 ' invention en un 
site non essentiel pour sa replication, le cas 6ch6ant sous 
le controle d' elements de regulation susceptibles 
d'intervenir dans 1' expression du polypeptide DP428, chez 
10 un note determine . 

Des vecteurs particuliers sont par exemple des 
plasmides, des phages, des cosmides, des phagemides, des 
YAC . 

Ces vecteurs sont utiles pour transformer des cellules 
15 hotes afin de doner ou d'exprimer les sequences 
nucleotidiques de 1' invention. 

L* invention comprend egalement les cellules hotes 
transformees par un vecteur selon 1' invention. 
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De preference, les cellules hotes sont transformees 
dans des conditions permettant 1' expression d 1 un 
polypeptide recombinant selon l f invention. 



Une cellules note pref<§ree selon 1 ! invention est la 
souche E . coli transformee par le plasmide pDP428 depose le 
28 janvier 1997 a la CNCM sous le N°I-1818 ou transformee 
par le plasmide pM!C25 depose le 4 aout 1998 a la CNCM sous 
le n° 1-2062 ou une mycobacterie appartenant a une souche 
de M . tuberculosis, M.bovis ou M.africanum possedant 
potentiellement tous les systemes de regulation appropries. 

II est aujourd'hui facile de produire des proteines ou 
polypeptides en quantite relativement importante par genie 
genetique en utilisant comme vecteurs d' expression des 
35 plasmides, des phages, des phagemides. Tout ou partie du 
gene DP428, ou tout polynucleotide selon 1' invention, peut 
etre insere dans un vecteur d' expression approprie pour 
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produire in vitro un polypeptide selon 1' invention, 
notamment le polypeptide DP428. Ledit polypeptide pourra 
etre fixe sur une microplaque pour developper un test 
sdrologique destin<§ a rechercher, dans un but de 
5 diagnostic, les anticorps sp£cifiques chez les patients 
atteints de tuberculose. 

Ainsi, la presente invention concerne un proc6de de 
preparation d'un polypeptide, caracterise en ce qu'il met 
10 en oeuvre un vecteur selon 1' invention. Plus 
particulierement 1* invention concerne un procede de 
preparation d 1 un polypeptide de 1' invention comprenant les 
etapes suivantes : 

- le cas echeant, 1 ■ amplification prealable suivant la 
technique PCR de la quantite de sequences de nucleotides 
codant pour ledit polypeptide a l'aide de deux amorces 
d'ADN choisies de maniere a ce que I'une de ces amorces 
soit identique aux 10 a 25 premiers nucleotides de la 
sequence nucleotidique codant pour ledit polypeptide, 
tandis que 1' autre amorce est complementaire des 10 a 25 
derniers nucleotides (ou s'hybride avec ces 10 a 25 
derniers nucleotides) de ladite sequence nucleot idique , ou 
inversement de maniere a ce que 1 ' une de ces amorces soit 
identique aux 10 a 25 derniers nucleotides de ladite 

25 sequence, tandis que 1' autre amorce est compl§mentaire des 
10 a 25 premiers nucleotides (ou s'hybride avec les 10 a 25 
premiers nucleotides) de ladite sequence nucleotidique, 
suivie de 1 ' introduction desdites sequences ainsi 
amplifiees dans un vecteur approprie, 

- la mise en culture, dans un milieu de culture approprie, 
d'un note cellulaire prealablement transforme par un 
vecteur approprie contenant un acide nucleique selon 
1' invention comprenant la sequence nucleotidique codant 
pour ledit polypeptide, et 

la separation, a partir du susdit milieu de culture, 
dudit polypeptide produit par ledit note cellulaire 
transforme . 
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L ' invention a aussi pour objet un polypeptide 
susceptible d'etre obtenu par un procede de 1 ' invention tel 
que decrit pr£cedemment . 
5 L es peptides selon 1' invention peuvent £galement etire 

prepares par les techniques classiques, dans le domaine de 
la synthese des peptides. Cette synthese peut etre realisee 
en solution homogene ou en phase solide. 

Par exemple, on aura recours a la technique de 
!() synthese en solution homogene decrite par Houbenweyl en 
1974 . 

Cette methode de synthese consiste a condenser 
successivement deux-a-deux les aminoacyles successifs dans 

15 l'ordre requis, ou a condenser des aminoacyles et des 
fragments prealablement formes et contenant deja plusieurs 
aminoacyles dans l'ordre appropne, ou encore plusieurs 
fragments prealablement ainsi prepares, etant entendu que 
l'on aura eu soin de proteger au prealable toutes les 

20 fonctions reactives portees par ces aminoacyles ou 
fragments, a 1' exception des fonctions amines de 1 1 un et 
carboxyles de 1 • autre ou vice- versa, qui doivent 
normalement intervenir dans la formation des liaisons 
peptidiques, notamment apres activation de la fonction 

25 carboxyle, selon les methodes bien connues dans la synthese 
des peptides. En variante, on pourra avoir recours a des 
reactions de couplage mettant en jeu des reactifs de 
couplage classique, du type carbodiimide , tels que par 
exemple la l-ethyl-3- ( 3 -dimethyl -aminopropyl ) -carbodiimide . 

30 Lorsque 1 ' aminoacyle mis en oeuvre possede une 

fonction acide supplementaire (notamment dans le cas de 
l'acide glutamique) , ces fonctions seront protegees, par 
exemple par des groupes t -butylester . 

Dans le cas de la synthese progressive, acide amine 

35 par acide amine, la synthese debute de preference par la 
condensation de 1 ' amino-acide C-terminal avec l'aminoacide 
qui correspond a 1 ' aminoacyle voisin dans la sequence 
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desiree et ainsi de suite, de proche en proche, jusqu'a 
l'acide amine N- terminal. 

Selon une autre technique pref£ree de 1' invention, on 
a recours a celle d6crite par Merrifield. 
5 Pour fabriquer une chaine peptidique selon le proc£de 

de Merrifield, on a recours a une r£sine polymere tres 
poreuse, sur laquelle on fixe le premier acide amine C- 
terminal de la chaine. Cet acide amine est fixe sur la 
resine par 1 ' intermediate de son groupe carboxylique et sa 
10 fonction amine est protegee, par exemple par le groupe t- 
butyloxycarbonyle . 

Lorsque le premier acide amine C-terminal est ainsi 
fixe sur la resine, on enleve le groupe protecteur de la 
15 fonction amine en lavant la resine avec un acide. 

Dans le cas oil le groupe protecteur de la fonction 

amine est le groupe t -butyloxycarbonyle , il peut etre 

elimine par traitement de la resine a I'aide d'acide 
20 trif luoroacetique . 

On couple ensuite le deuxieme acide amine qui fournit 
le second aminoacyle de la sequence recherchee, a partir du 
residu aminoacyle C-terminal sur la fonction amine 
25 deprotegee du premier acide amine C-terminal fixe sur la 
chaine. De preference, la fonction carboxyle de ce deuxieme 
acide amine est activee, par exemple par la 
dicyclohexylcarbodiimide, et la fonction amine est 
protegee, par exemple par le t -butyloxycarbonyle . 

On obtient ainsi la premiere partie de la chaine 
peptidique recherchee, qui comporte deux acides amines, et 
dont la fonction amine terminale est protegee. Comme 
precedemment, on deprotege la fonction amine et on peut 
ensuite proceder a la fixation du troisieme aminoacyle, 
dans des conditions analogues a celles de 1' addition du 
deuxieme acide amine C-terminal. 
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On fixe ainsi, les uns apres les autres, les acides 
amines qui vont constituer la chaine peptidique sur le 
groupe amine chaque fois deprotege au prealable de la 
portion de la chaine peptidique deja formee, et qui est 
rattach£e a la rSsine. 

Lorsque la totality de la chaine peptidique desiree 
est formee, on elimine les groupes protecteurs des 
differents acides amines constituant la chaine peptidique 
et on detache le peptide de la resine, par exemple a 1'aide 
d'acide f luorhydrique . 

De maniere pref erentielle , lesdits polypeptides 
susceptibles d'etre obtenus par un precede de 1' invention 
tel que decrit precedemment comprendront une region exposee 
au solvant et auront une longueur d 1 au moins 20 acides 
amines . 

Selon un autre mode de realisation de 1« invention, 
lesdits polypeptides sont specifiques de mycobacteries du 
complexe Mycobacterium tuberculosis et ne sont done pas 

reconnus par des anticorps specifiques d' autres proteines 
de mycobacteries. 

L ' invention est en outre relative a des polypeptides 
hybrides presentant au moins un polypeptide selon 
1' invention et une sequence d'un polypeptide susceptible 
d'induire une reponse immunitaire chez 1 1 homme ou 1 • animal . 

Avantageusement, le determinant antigenique est tel 
qu'il est susceptible d'induire une reponse humorale et/ou 
30 cellulaire. 

Un tel determinant pourra comprendre un polypeptide 
selon 1' invention sous forme glycosylee utilise en vue 
d'obtenir des compositions immunogenes susceptibles 
35 d'induire la synthese d' anticorps diriges contre des 
epitopes multiples. Lesdits polypeptides glycosyles font 
egalement partie de 1' invention. 
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Ces molecules hybrides peuvent etre constitutes en 
partie d ' une molecule porteuse de polypeptide selon 
1' invention associee a une partie, en particulier un 
epitope de la toxine diphterique, la toxine tetanique, un 
5 antigene de surface du virus de 1' hepatite B (brevet FR 79 
21811), l'antigene VP1 du virus de la poliomyelite ou toute 
autre toxine ou antigene viral ou bact£rien. 

Avantageusement, ledit determinant antigenique 
lo correspond a un determinant antigenique de proteines 
immunogenes de 45/47 kD de M . tuberculosis (demande 
Internationale PCT/FR 96/0166), ou encore selectionnees par 
exemple parmi ESAT6 (Harboe et al . , 1996, Andersen et al . , 
1995, et Sorensen et al . , 1995) et DES (PCT/FR 97/00923, 
15 Gicquel et al . ) . 

Un antigene viral, tel que defini ci-dessus, sera 
preferentiellement une proteine de surface ou d'enveloppe 
d'un virus de 1 'hepatite, par exemple la proteine de 
surface de 1' hepatite B sous 1 1 une de ses formes s, S- 
preSl, S-preS2 ou S-preS2-preSl ou encore une proteine d'un 
virus de 1 'hepatite A, ou d'une hepatite non-A, non-B, tel 
qu'un virus de 1' hepatite C, E ou delta. 
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Plus particulierement, un antigene viral tel que 
defini ci-dessus sera tout ou partie de l'une des 
glycoproteines codees par le genome du virus HIV-l (brevets 
GB 8324800, EP 84401834 ou EP 85905513) ou du virus HIV-2 
(EP 87400151), et en particulier tout ou partie d'une 
proteine select ionnee parmi gag, pol, nef ou env de HIV-l 
ou de HIV-2. 

Les procedes de synthese des molecules hybrides 
englobent les methodes utilisees en genie genetique pour 
construire des polynucleotides hybrides codant pour les 
sequences polypeptidiques recherchees. On pourra, par 
exemple, se referer avantageusement a la technique 
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d'obtention de genes codant pour des proteines de fusion 
decrite par Minton en 1984 . 

Lesdits polynucleotides hybrides codant pour un 
polypeptide hybride ainsi que les polypeptides hybrides 
selon 1' invention caracterises en ce qu'il s'agit de 
proteines recombinantes obtenues par 1 'expression desdits 
polynucleotides hybrides, font egalement partie de 
1 1 invention . 

Les polypeptides selon 1 ' invention peuvent 
avantageusement etre mis en oeuvre dans un procede pour la 
detection in vitro d'anticorps diriges contre lesdits 
polypeptides, notamment le polypeptide DP428, et ainsi 
d'anticorps diriges contre une bacterie du complexe 
Mycobacterium tuberculosis, dans un echantillon biologique 
(tissu ou fluide biologique) susceptible de les contenir, 
ce procede comprenant la mise en contact de cet echantillon 
biologique avec un polypeptide selon 1 ' invention dans des 
conditions permettant une reaction immunologique in vitro 
entre ledit polypeptide et les anticorps eventuellement 
presents dans 1 ' echantillon biologique, et la mise en 
evidence in vitro des complexes antigene-anticorps 
eventuellement formes. 



Les polypeptides selon 1' invention peuvent egalement 
et avantageusement etre mis en oeuvre dans un procede pour 
la detection d'une infection par une bacterie du complexe 
Mycobacterium tuberculosis dans un mammifere base sur la 
detection in vitro d'une reaction cellulaire indiquant une 
sensibilisation prealable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire, la synthese 
de proteines telles que 1 ' interferon gamma. Ce procede pour 
la detection d'une infection par une bacterie du complexe 
35 Mycobacterium tuberculosis dans un mammifere, est 
caracterise en ce qu'il comprend les etapes suivantes : 
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a) preparation d ' un echantillon biologique contenant des 
cellules dudit mammifere plus part icul ierement des cellules 
du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 

b) incubation de 1 1 echantillon biologique de l'etape a) 
avec un polypeptide selon 1' invention,- 

c) detection d'une reaction cellulaire indiquant une 
sensibilisation prealable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire et/ou la 
synthese de proteines telles que 1 ' interferon gamma. 

La proliferation cellulaire pourra etre mesuree, par 
exemple par incorporation de ! H-Thymidine . 

Font egalement partie de 1' invention, les procedes de 
15 detection d'une reaction d • hypersensibilite retardee (DTH) 
caracterises en ce qu'ils mettent en oeuvre un polypeptide 
selon 1' invention. 
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De preference, 1 • echantillon biologique est constitue 
par un fluide, par exemple un serum humain ou animal, du 
sang, des biopsies, le liquide broncho-alveolaire ou le 
liquide pleural. 

Toute procedure classique peut etre mise en oeuvre 
25 pour realiser une telle detection. 

A titre d' exemple, une methode preferee met en jeu des 
processus immunoenzymatiques selon la technique ELISA, par 
immunofluorescence, ou radio- immunologique (RIA) ou 
30 equivalent. 

Ainsi, 1" invention concerne egalement les polypeptides 
selon 1- invention, marques a l'aide d'un marqueur adequat 
tel que du type enzymatique, fluorescent, radioactif . 

De telles methodes comprennent par exemple les etapes 
suivantes : 
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- depot de quantites determines d'une composition 
polypeptidique selon 1 ' invention dans les puits d 1 une 
plaque de microtitration, 

- introduction dans lesdits puits de dilutions croissantes 
de serum, ou d • echantillon biologique autre tel que defini 
precddemment , devant etre analyse, 

- incubation de la microplaque, 
introduction dans les puits de la plaque de 

microtitration d'anticorps marques diriges contre des 
immunoglobulines humaines ou animales, le marquage de ces 
anticorps ayant ete realise a 1-aide d'une enzyme 
selectionnee parmi celles qui sont capables d'hydrolyser un 
substrat en modifiant 1' absorption des radiations de ce 
dernier, au moins a une longueur d ' onde determinee, par 
exemple a 550 nra, 

- detection, en comparaison avec un temoin de controle, de 
la quantite de substrat hydrolyse. 

L 1 invention concerne egalement un necessaire ou kit 
20 pour le diagnostic in vitro d'une infection par une 
mycobacterie appartenant au complexe Mycobacterium 
tuberculosis, comprenant : 

- un polypeptide selon 1' invention, 

- le cas echeant les reactifs pour la constitution du 
25 milieu propice a la reaction immunologique ou specifique, 

- les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique 
eventuellement presents dans 1 • echantillon biologique, et 
la mise en evidence in vitro des complexes antigene- 

30 anticorps eventuellement formes, ces reactifs pouvant 
egalement porter un marqueur, ou etre susceptibles d'etre 
reconnus a leur tour par un reactif marque, plus 
particulierement dans le cas ou le polypeptide selon 
1' invention n'est pas marque, 

35 - le cas echeant, un echantillon biologique de reference 
(temoin negatif) depourvu d'anticorps reconnus par un 
polypeptide selon 1' invention, 
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- le cas echeant, un echantillon biologique de reference 
(temoin positif) contenant une quantite predetermine 
d" anticorps reconnus par un polypeptide selon 1' invention. 

Les polypeptides selon 1- invention permettent de 
preparer des anticorps monoclonaux ou polyclonaux 
caracterises en ce qu'ils reconnaissent specif iquement les 
polypeptides selon 1' invention. Les anticorps monoclonaux 
pourront avantageusement etre prepares a partir 
d'hybridomes selon la technique decrite par Kohler et 
Milstein en 1975. Les anticorps polyclonaux pourront etre 
prepares, par exemple par immunisation d'un animal, en 
particulier une souris, avec un polypeptide selon 
1' invention associe a un adjuvant de la reponse 
15 immunitaire, puis purification des anticorps specifiques 
contenus dans le serum des animaux immunises sur une 
colonne d'af finite sur laquelle a prealablement ete fixe le 
polypeptide ayant servi d'antigene. Les anticorps 
polyclonaux selon 1 ' invention peuvent aussi etre prepares 
par purification sur une colonne d'affinite, sur laquelle a 
prealablement ete immobilise un polypeptide selon 
1' invention, des anticorps contenus dans le serum de 
patients infectes par une mycobacterie et 

preferentiellement une bacterie appartenant au complexe 
25 Mycobacterium tuberculosis . 



20 



L' invention a egalement pour objet des anticorps mono 
ou polyclonaux ou leurs fragments, ou anticorps 
30 chimeriques, caracterises en ce qu'ils sont capables de 
reconnaitre specif iquement un polypeptide selon 
1 1 invention . 



Les anticorps de 1' invention pourront egalement etre 
35 marques de la meme maniere que decrit precedemment pour les 
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sondes nucleiques de 1' invention tel qu'un marquage de type 
enzymatique, fluorescent ou radioactif. 

L 1 invention vise en outre un precede pour la detection 
specifique de la presence d'un antigene d'une mycobacterie 
et pr£ferentiellement un bacterie du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les Stapes suivantes : 



a) Mise en contact de 1 • echantillon biologique (tissu ou 
fluide biologique) preleve chez un individu avec un 
anticorps mono ou polyclonal selon 1' invention , dans des 
conditions permettant une reaction immunologique in vitro 
entre lesdits anticorps et les polypeptides specifiques des 

15 mycobacterias et pref erentiellement des bacteries du 
complexe de Mycobacterium tubercuiosis eventuel lement 
presents dans 1 ' echantillon biologique, et 

b) Mise en evidence du complexe antigene -ant icorps forme. 



un 
un 



Entre egalement dans le cadre de 1' invention, 
necessaire ou kit pour le diagnostic in vitro sur 
echantillon biologique, de la presence de souches de 
mycobacteries des mycobacteries et pref erentiellement des 
bacteries appartenant au complexe de Mycobacterium 
tuberculosis, de preference M. tuberculosis, caracterise en 
ce qu'il comprend : 

- un anticorps polyclonal ou monoclonal selon 1' invention, 
le cas echeant marque; 

- le cas echeant, un reactif pour la constitution du milieu 
propice a la realisation de la reaction immunologique; 

- un reactif permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique, 
ce reactif pouvant egalement porter un marqueur, ou etre 
susceptible d'etre reconnu a son tour par un reactif 
marque, plus particulierement dans le cas ou ledit 
anticorps monoclonal ou polyclonal n'est pas marque. 



WO 99/09186 



PCT/FR98/01813 



52 



10 



5 



0 



5 



- le cas echeant, des reactifs pour effectuer la lyse des 
cellules de 1 ' echant illon teste. 

La presente invention a Sgalement pour objet un 
proc<§d<§ de detection et d ■ identification rapide des 
mycobacteries et pr£f Srent iellement des bactSries de M. 
tuberculosis dans un 6chantillon biologique, caract6ris£ 
en ce qu'il comporte les etapes suivantes : 

a) Isolement de 1-ADN a partir de 1 ■ <§chant illon 
biologique a analyser, ou obtention d ' un ADNc a partir de 
l'ARN de 1 'echantillon biologique ; 

b) Amplification specif ique de 1 ' ADN des mycobacteries et 
prSferentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis a l'aide d' amorces selon 
1 ' invention; 

c) Analyse des produits d ' amplification . 

Le produits d - amplification peuvent etre analyses par 
differentes methodes. 

Deux methodes d- analyse sont donnees a titre d'exemple 
ci-dessous : 

- Analyse electrophoretique en gel d< agarose des 
produits d' amplification. La presence d'un fragment d ' ADN 
migrant a l'endroit attendu suggere que 1 • echantillon 
analyse contenait de 1 1 ADN de mycobacteries appartenant au 
complexe tuberculosis, ou 

- Analyse par la technique d ' hybridation moleculaire 
en utilisant une sonde nucleique selon 1- invention. Cette 
sonde sera avantageusement marquee par un element non 
radioactif (sonde froide) ou radioactif. 

Aux fins de la presente invention, on entendra par 
« ADN de 1- echantillon biologique » ou « ADN contenu dans 
1 'echantillon biologique », soit 1-ADN present dans 
1 echantillon biologique considere, soit l'ADNc obtenu 
apres 1' action d'une enzyme de type transcriptase inverse 
sur l'ARN present dans ledit echantillon biologique. 
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Un autre precede" de la presente invention permet la 
detection d 1 une infection par une mycobact^rie et 
5 prSferentiellement une bacterie du complexe Mycobacterium 
tuberculosis dans un mammifere. Ce precede comprend les 
Stapes suivantes : 

a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 

10 du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 

b) incubation de 1 • echantillon biologique de l'etape a) avec 
un polypeptide selon 1' invention; 

O detection d'une reaction cellulaire indiquant une 
sensibilisation prealable du mammifere audit polypeptide 
notamment la proliferation cellulaire et/ou la synthese de 
proteines telles que 1 • interferon gamma; 

d) detection d'une reaction d ' hypersensibilite retardee ou 
de sensibilisation du mammifere audit polypeptide. 
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Cette methode de detection est une methode 
intradermique, qui est dScrite par exemple par M. J. Elhay 
et al. (1988) Infection and Immunity, 66(7) : 3454-3456. 



Un autre but de la presente invention consiste en un 
proedde pour la detection des mycobacteries et 
pr<§ferentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis dans un echantillon biologique, 
caracterise en ce qu'il comprend les Stapes suivantes : 
30 a) Mise en contact d'une sonde oligonucleotidique selon 
1' invention avec un echantillon biologique, l'ADN contenu 
dans 1- echantillon biologique, ou 1 ' ADNc obtenu par 
transcription inverse de 1 ' ARN de 1 - echantillon biologique, 
ayant, le cas echeant, prealablement ete rendu accessible a 
1* hybridation, dans des conditions permettant 1 ' hybridat ion 
de la sonde a l'ADN ou l'ADNc des mycobacteries et 
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preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis ; 

b) Detection de l'hybride forme entre la sonde 
oligonucleotidique et l'ADN de 1 ' echantillon biologique. 

L 1 invention vise egalement un procede pour la detection 
des mycobacteries et preferentiellement des bacteries 
appartenant au complexe Mycobacterium tuberculosis dans un 
echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 

a) Mise en contact d'une sonde oligonucleotidique selon 
1' invention immobilisee sur un support, avec un 
echantillon biologique, l'ADN de 1 • echantillon biologique 
ayant, le cas echeant, ete prealablement rendu accessible a 
1 'hybridation, dans des conditions permettant 1 1 hybridation 
de ladite sonde a l'ADN des mycobacteries et 
prSferentiellement des bacteries du complexe Mycobacterium 
tuberculosis ; 

b) Mise en contact de l'hybride forme entre ladite sonde 
oligonucleotidique immobilisee sur un support et l'ADN 
contenu dans 1 • echantillon biologique, le cas echeant apres 
Elimination de l'ADN de 1 • echantillon biologique n' ayant 
pas hybride avec la sonde, avec une sonde 
oligonucleotidique marquee selon 1' invention. 

Selon un mode de realisation avantageux du procede de 
detection defini prScedemment , celui-ci est caracterise en 
ce que, prealablement a l'etape a), 1 • ADN de 1 ' echantillon 
biologique est prealablement amplifie a l'aide d'un couple 
d 1 amorces selon 1' invention. 



Une autre forme de mise en oeuvre du procede de 

detection selon 1' invention consiste en un procede pour la 

detection de la presence des mycobacteries et 

35 preferentiellement des bacteries appartenant au complexe de 
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Mycobacterium tuberculosis dans un echantillon biologique, 
caracterise en ce qu'il comprend les etapes suivantes : 

a) Mise en contact de 1 ' echantillon biologique avec un 
couple d'amorces selon 1' invention, 1 ' ADN contenu dans 
1 Echantillon ayant fite. le cas echeant, prealablement 
rendu accessible a 1 ■ hybridation , dans des conditions 
permettant une hybridation desdites amorces a 1 1 ADN des 
mycobacteries et pref Erentiellement des bacteries du 
complexe Mycobacterium tuberculosis ,- 

b) Amplification de l'ADN d'une mycobacterie et 
pref erentiellement d'une bacterie du complexe Mycobacterium 
tuberculosis ; 



O mise en evidence de 1 ' amplification de fragments d 1 ADN 
correspondant au fragment encadre par les amorces, par 
exemple par electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique selon invention. 

L' invention a aussi pour ob 3 et un precede pour la 
detection de la presence des mycobacteries et 
preferentiellement des bacteries appartenant au complexe de 
Mycobacterium tuberculosis dans un echantillon biologique 
par deplacement de brin, caracterise en ce qu'il comprend 
les etapes suivantes : 

a) Mise en contact de 1 ' echantillon biologique avec deux 
couples d'amorces selon 1' invention specif iquement 
destinees a 1 ' amplification de type SDA decrites ci-dessus, 
ADN contenu dans 1 • echantillon ayant ete, le cas echeant! 
prealablement rendu accessible a 1 • hybridat ion , dans des 
conditions permettant une hybridation des amorces a l'ADN 
des mycobacteries et preferentiellement des bacteries du 
complexe Mycobacterium tuberculosis; 
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b) amplification de 1 ■ ADN des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis ; 

O mise en evidence de 1 'amplification de fragments d ' ADN 
correspondant au fragment encadre par les amorces, par 
exemple par electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique selon 1' invention. 

L' invention concerne aussi un necessaire ou kit pour 
la mise en oeuvre du precede decrit ci-dessus, destine a la 
detection de la presence des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les elements suivants : 

a) Une sonde oligonucleotidique selon 1 ' invention ; 

b) Les reactifs necessaires a la mise en oeuvre d'une 
reaction d 1 hybridation ; 

O Le cas echeant, un couple d' amorces selon 1- invention 
ainsi que les reactifs necessaires a une reaction 
d- amplification de l'ADN (ADN genomique, ADN plasmidique ou 
ADNc ) des mycobacteries et preferentiellement des bacteries 
du complexe Mycobacterium tuberculosis. 

L< invention a aussi pour objet un kit ou necessaire 
pour la detection de la presence des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les elements suivants : 

a) Une sonde oligonucleotidique, dite sonde de capture, 
30 selon 1 ' invention ; 

b) ^ Une sonde oligonucleotidique, dite sonde de 
revelation, selon 1' invention. 

O Le cas echeant, un couple d' amorces selon 1 • invention 
ainsi que les reactifs necessaires a une reaction 
d- amplification de 1 ' ADN des mycobacteries 
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preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis . 

L ' invention concerne encore un kit ou nScessaire pour 
5 1' amplification de l'ADN des mycobacterias et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis present dans un echantillon biologique, 
caracterise en ce qu'il comprend les elements suivants : 
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a) Un couple d' amorces selon 1' invention; 

b) Les reactifs necessaires pour effectuer une reaction 
d' amplification d ' ADN ; 

O Eventuellement un composant permettant de verifier la 
sequence du fragment amplifie, plus part iculierement une 
sonde oligonucleot idique selon 1' invention. 

Un autre objet de la presente invention concerne une 
composition immunogene, caracterisee en ce qu'elle comprend 
un polypeptide selon 1' invention. 

Une autre composition immunogene selon 1' invention est 
caracterise en ce qu'elle comprend un ou plusieurs 
polypeptides selon 1* invention et/ou un ou plusieurs 
polypeptides hybrides selon 1' invention. 

Selon un mode de realisation avantageux, la 
composition immunogene ci-dessus definie est constitutive 
d'un vaccin, lorsqu'elle est presentee en association avec 
un vehicule pharmaceut iquement acceptable et eventuellement 
un ou plusieurs adjuvants de 1 ' immunity tels que 1 ' alun ou 
un representant de la famille des muramyl peptides ou 
encore 1' adjuvant incomplet de Freund. 



35 



Aujourd'hui, divers types de 
pour proteger 1 ' homme contre des 
micro-organismes vivants attenues 



vaccins sont disponibles 
maladies infectieuses : 
(M. bovis - BCG pour la 
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tuberculose) , micro-organismes inactives (virus de la 
grippe), des extraits acellulaires (Bordetella pertussis 
pour la coqueluche), prolines recombinees (antigene de 
surface du virus de 1- hepatite B) , des polyosides 
(pneumocoques) . Des vaccins prepares a partir de peptides 
de synthese ou de micro-organismes genetiquement modifies 
exprimant des antigenes heterologies sont en cours 
d' experimentation. Plus recemment encore, des ADN 
plasmidiques recombines portant des genes codant pour des 
antigenes protecteurs ont ete proposes comme strategie 
vaccinale alternative. Ce type de vaccination est realise 
avec un plasmide particulier derivant d • un plasmide de E. 
coli qui ne se replique pas in vivo et qui code 
uniquement pour la proteine vaccinante. Les principaux 
composants fonctionnels de ce plasmide sont : un promoteur 
fort permettant 1' expression dans les cellules eucaryotes 
(par exemple celui du CMV) , un site de clonage approprie 
pour inserer le gene d'interet, une sequence de 
terminaison-polyadenylation, une origine de replication 
procaryote pour produire le plasmide recombine in vitro 
et un marqueur de selection (par exemple le gene de 
resistance a 1 ' ampicilline) pour faciliter la selection 
des bacteries qui contiennent le plasmide. Des animaux ont 
ete immunises en injectant simplement 1 1 ADN plasmidique nu 
dans le muscle. Cette technique conduit a 1- expression de 
la proteine vaccinale in situ et a une reponse 
immunitaire en particulier de type cellulaire (CTL) et de 
type humoral (anticorps) . Cette double induction de la 
reponse immunitaire est l'un des principaux avantages de 
la technique de vaccination avec de l'ADN nu . Huygen et 
al. (1996) et Tascon et al . (1996) ont reussi a obtenir 
une certaine protection centre M. tuberculosis en 
injectant des plasmides recombines contenant des genes de 
M. leprae {hsp65, 36kDa pra ) comme inserts, w. leprae 
est 1- agent responsable de la l epre . L ' utilisation d'un 
insert specifique de M. tuberculosis comme par exemple 
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tout ou partie du gene DP428 , ob jet de la presence 
invention conduirait probablement a une meilleure 
protection centre la tuberculosa. Tout ou partie du gene 
DP428. ou tout polynucleotide selon 1- invention, peut etre 
facilement insert dans l es pl aS mides vecteurs VU 
(Montgomery et al, 1993). P cDNA3 (Invitrogen, R & D 
Systems) ou pcDNAl/Neo (Invxtrogen) qui possedent les 
caracteristiques necessaires pour une utilisation 
vaccinale . 

L ' invention vise ainsi un vaccin, caracterisee en ce 
qu'il comprend un ou plusieurs polypeptides selon 
1' invention et/ou un ou plusieurs polypeptides hybrides 
selon 1' invention tels que precedemment definis en 
association avec un vehicule pharmaceutiquement compatible 
Gt ; le cas echeant, un ou plusieurs adjuvants de 
l'immunite appropries. 

L ' invention vise aussi une composition vaccinale 
20 destinee a 1 ' immunisation de 1 ■ homme ou 1' animal a 
l'encontre d 1 une infection bacterienne ou virale, telle que 
la tuberculose ou 1 'hepatite, caracterisee en ce qu'elle 
comprend un ou plusieurs polypeptides hybrides tels que 
precedemment definis en association avec un vehicule 
pharmaceutiquement compatible et, le cas echeant, un ou 
plusieurs adjuvants de l'immunite. 



15 



25 



Avantageusement, dans le cas d ' une proteine hybride 
entre un polypeptide selon 1' invention et l'antigene de 

30 surface de l'hepatite B, la composition vaccinale sera 
administree, chez 1' homme, a raison de 0,1 a 1 m de 
proteine hybride purifiee par kilogramme du poids du 
patient, de preference 0,2 a 0,5 M g/kg de poids du patient, 
pour une dose destinee a une administration donnee . Dans le 

35 cas de patients atteints de troubles du systeme 
immunitaire, en particulier les patients immunodeprimes , 
chaque dose injectee contiendra pref erentiellement la 
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moitie de la quantite ponderale de la proteine hybride 
contenue dans une dose destinee a un patient n'etant pas 
affects de troubles du systeme immunitaire . 

De preference, la composition vaccinale sera 
administrSe a plusieurs reprises, de maniere etalee dans le 
temps, par voie intradermique ou sous -cutanee . A titre 
d'exemple. trois doses telles que definies ci-dessus seront 
respectivement administrees au patient au temps to, au 
temps to + l mois et au temps to + l an. 

Alternativement, trois doses seront respectivement 
administrees au patient au temps to, au temps to + i mois 
et au temps to + 6 mois. 

Chez la souris, chez laquelle une dose ponderale de la 
composition vaccinale comparable a la dose utilisee chez 
l'homme est administree, la reaction anticorps est testee 
par prelevement du serum suivi d'une etude de la formation 
d'un complexe entre les anticorps presents dans le serum et 
l'antigene de la composition vaccinale, selon les 
techniques usuelles. 



L ' invention concerne egalement une composition 
immunogene caracterisee en ce q U 'elle comprend un 
25 polynucleotide ou un vecteur d • expression selon 
1' invention, en association avec un vehicule permettant son 
administration a l'homme ou 1" animal. 



L' invention a encore pour objet un vaccin destine a 
1' immunisation a l'encontre d'une infection bacterienne ou 
virale, telle que la tuberculose ou 1- hepatite, caracterise 
en ce qu'il comprend un polynucleotide ou un vecteur 
d' expression selon 1' invention, en association avec 
vehicule pharmaceutiquement acceptable. 



un 



De telles compositions immunogenes ou vaccinales sont 
notamment decrites dans la demande Internationale N° wo 
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90/11092 (Vical Inc.) et egalement dans la demande 
Internationale N° WO 95/11307 (Institut Pasteur). 

Le polynucleotide constitutif de la composition 
immunogene ou de la composition vaccinale selon 1' invention 
peut etre injecte" a l-hote apres avoir ete couple a des 
composes qui favorisent la penetration de ce polynucleotide 
a l'int6rieur de la cellule ou son transport jusqu'au noyau 
cellulaire. Les conjugues resultants peuvent etre 
encapsules dans des microparticules polymeres, comme decrit 
dans la demande Internationale N° WO 94/27238 (medisorb 
Technologies International) . 

Selon un autre mode de realisation de la composition 
15 immunogene et/ou vaccinale selon 1' invention, le 
polynucleotide, de preference un ADN, est complexe avec du 
DEAE-dextran (Pagano et al., 1967) ou avec des proteines 
nucleaires (Kaneda et al . , 1989), avec des lipides (Feigner 
et al., 1987) ou encore encapsules dans des liposomes 
20 (Fraley et al., 1980). 

Selon encore un autre mode de realisation avantageux 
de la composition immunogene et/ou vaccinale selon 
1' invention, le polynucleotide selon 1- invention peut etre 
introduit sous la forme d'un gel facilitant sa transfection 
dans les cellules. Une telle composition sous forme de gel 
peut etre un complexe de poly-L-lysine et de lactose, comme 
decrit par Midoux en 1993, ou encore le Poloxamer 407™, 
comme decrit par Pastore en 1994. Le polynucleotide ou le 
vecteur selon 1' invention peuvent aussi etre en suspension 
dans une solution tampon ou etre associes a des liposomes. 

Avantageusement, un tel vaccin sera prepare 
conformement a la technique decrite par Tacson et al . ou 
Huygen et al . en 1996 ou encore conformement a la technique 
decrite par Davis et al . dans la demande Internationale N° 
WO 95/11307 (Whalen et al . ) . 
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Un tel vaccin sera avantageusement prepare sous la 
forme d • une composition contenant un vecteur selon 
1' invention, placee sous le controle d' elements de 
regulation permettant son expression chez 1 • homme ou 
1 ' animal . 



Pour realiser un tel vaccin, le polynucleotide selon 
1' invention est tout d'abord sous-clone dans un vecteur 
d'expression approprie, plus particulierement un vecteur 
d' expression contenant des signaux de regulation et 
d'expression reconnus par les enzymes des cellules 
eucaryotes et contenant egalement une origine de 
replication active chez les procaryotes, par exemple chez 
E. coli, qui permet son amplification prealable. Puis le 
plasmide recombinant purifie obtenu est injecte a l'hote, 
par exemple par voie intramusculaire . 

On pourra par exemple utiliser, en tant que vecteur 
d'expression in vivo de l'antigene d'interet, le plasmide 
PCDNA3 ou le plasmide pcDNAl/neo, tous les deux 
commercialises par Invitrogen ( R&D Systems, Abingdon, 
Royaume-Uni) . On peut aussi utiliser le plasmide VUns-tPA^ 
decrit par Shiver et al . en 1995. 

Un tel vaccin comprendra avantageusement, outre le 
vecteur recombinant, une solution saline, par exemple une 
solution de chlorure de sodium. 

Une composition vaccinale telle que definie ci-dessus sera 
par exemple administree par voie parenteral ou par voie 
intramusculaire . 

La presente invention concerne egalement un vaccin 
caracterise en ce qu'il contient une ou plusieurs sequences 
nucleotidiques selon 1' invention et/ou un ou plusieurs 
polynucleotides tel que mentionne ci-dessus en association 
avec un vehicule pharmaceutiquement compatible et, le cas 
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echeant, un ou plusieurs adjuvants de 1 ■ immunity 
appropri6s . 

Un autre aspect porte sur une mgthode de criblage de 
molecules capables d'inhiber la crcassance de mycobacteries 
ou le maintien de mycobacteries dans un note, caracterisee 
en ce que lesdites molecules bloquent la synthese ou la 
fonction des polypeptides codes par une sequence 
nucleotidique selon !■ invention ou par un polynucleotide 
tel que decrit supra. 

Dans ladite methode de criblage, les molecules peuvent 
etre des anti -messagers ou peuvent induire la synthese 
d' anti -messagers . 

La presente invention vise egalement des molecules 
capables d'inhiber la croissance de mycobacteries ou le 
maintien de mycobacteries dans un hate, caracterisees en ce 
que lesdites molecules sont synthetisees d'apres la 
structure des polypeptides codes par une sequence 
nucleotidique selon !• invention ou par un polynucleotide 
tel que decrit supra. 

D ' autres caracteristiques et avantages de 1 - invention 
apparaissent dans les exemples et les figures suivants : 
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FIGURES 



La ser ie de Figures 1 



La serie de Figures l illustre la serie de sequences 
nucleotidiques SEQ id N°l correspondant a 1 • insert du 
vecteur pDP428 (depose a la CNCM sous le N° 1-1818) et 
35 la serie de sequences d'acides amines SEQ ID N°l des 
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polypeptides codes par la serie des sequences 
nucleotidiques SEQ ID N°i. 

Figure 2 : 

Illuatre la sequence nucleotidique SEQ id n°2 
correspondant a la region incluant le gene codant pour 
le polypeptide DP428 (region soulignee) . Sur cette 
figure ont 6t6 pris en compte a la fois les codons ATG 
et GTG d' initiation de la traduction. La figure fait 
apparaitre que le polypeptide DP428 fait probablement 
partie d ' un operon comprenant au moins trois genes. La 
region doublement encadree inclut probablement les 
regions promotrices. 

La region simplement encadree correspond au motif LPISG 
rapellant le motif LPXTG decrit chez les bacterie 
Gram positifs comme permettant l'ancrage 
peptidoglycannes . 



s a 
aux 



20 La serie de Figures 3 : 

La serie de Figures 3 represente la serie de sequences 
nucleotidiques SEQ ID N°3 correspondant a 1 - insert du 
vecteur P 6D7 (deposS a la CNCM sous le N° 1-1814). 



La ser ie de Figures 4 • 

La serie de Figures 4 represente la serie de sequences 
nucleotidiques SEQ ID N°4 correspondant a 1 ' insert du 
vecteur p5A3 (depose a la CNCM sous le N° 1-1815. 

La seri e de Figures 5 ; 

La serie de Figures 5 represente la serie de sequences 
nucleotidiques SEQ ID N°5 correspondant a 1 ' insert du 
vecteur p5F6 (depose a la CNCM sous le N° 1-1816). 
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La serie ri e Figures 6 • 

La serie de Figures 6 represente la serie de sequences 
nucleotidiques SEQ ID N<*6 correspondant a 1 ■ insert du 
vecteur p2A29 (d6pose a la CNCM sous le N° 1-1817). 

La s6rie de Figures 7 ; 

La sSrie de Figures 7 represente la serie de sequences 
nucleotidiques SEQ ID N°7 correspondant a 1 ' insert du 
vecteur p5B5 (depose a la CNCM sous le N° 1-1819) . 

La sdrie d e Figures fl - 

La serie de Figures 8 represente serie de sequences 
nucleotidiques SEQ ID N°8 correspondant a 1 ' insert du 
vecteur plC7 (depose a la CNCM sous le N° 1-1820) . 

La serie d e Figures 9 • 

La sSrie de Figures 9 represente la serie de sequences 
nucleotidiques SEQ ID N°9 correspondant a 1 < insert du 
vecteur p2D7 (depose a la CNCM sous le N° 1-1821) . 

La serie de Figures 10 : 

La serie de Figures 10 represente la serie de sequences 
nucleotidiques SEQ ID N°10 correspondant a 1' insert du 
vecteur plB7 (depose a la CNCM sous le N° 1-1843) . 

30 La serie de Figures 11 : 

La serie de Figures 11 represente la serie de sequences 
nucleotidiques SEQ ID N°ll. 
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35 La seri e de Figures 12 
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La serie de Figures 12 represente la serie de sequences 
nucleotidiques SEQ ID N°12. 

La ser ie de Figures 13 : 

La serie de Figures 13 represente la serie de sequences 
nucleotidiques SEQ ID N°13, 

La se rie de Figures 14 ■ 

La serie de Figures 14 represente la serie de sequences 
nucleotidiques SEQ ID N°14 correspondan t a 1 ■ insert du 
vecteur p5B5 (depose a la CNCM sous le N° 1-1819). 



15 



La s£rie de Figures IS ■ 



La serie de Figures 15 represente la serie de sequences 
20 nucleotidiques SEQ ID N°15. 



La s6rie de Figures lfi 



La serie de Figures 16 represente la serie de sequences 
25 nucleotidiques SEQ ID N°16. 



La serie de Figures 17 - 



La serie de Figures 17 represente la serie de sequences 
30 nucleotidiques SEQ ID N°17. 



La serie de Figures lfl 



La serie de Figures 18 represente la serie de sequences 
35 nucleotidiques SEQ ID N°18. 



La seri e de Figures 19 
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La serie de Figures 19 represente la serie de sequences 
nucleotidiques SEQ ID N°19. 

5 La s6ri e de Figures 20 : 

La serie de Figures 20 represente la s£rie de sequences 
nucleotidiques SEQ ID N°20 correspondant a 1 ' insert du 
vecteur p2A29 {deposS a la CNCM sous le N° 1-1817). 

La serie de Figures 21 : 

La serie de Figures 21 represente la serie de sequences 
nucleotidiques SEQ ID N°21. 

La serie d<=> Figures 2? • 

La serie de Figures 22 represente la serie de sequences 
nucleotidiques SEQ ID N°22. 

La serie de Figures 21 ■ 



15 



La serie de Figures 23 represente la serie de sequences 
nucleotidiques SEQ ID N°23. 

25 

La ser ie de Figures 24 : 

La serie de Figures 24 represente la serie de sequences 
nucleotidiques SEQ ID N°24. 

30 

Figures 25 et 26 ; 

Les figures 25 et 26 illustrent respect ivement les 
sequences SEQ ID N°25 et SEQ ID N°26 representant un 
couple d'amorces utilisees pour amplifier 
35 specifiquement par PCR la region correspondant aux 
nucleotides 964 a 1234 inclus dans la sequence SEQ ID 
N°l . 
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La ser ie de Figures 27 r 

La sene de Figures 27 represente la s6rie de sequences 
nucleotidiques SEQ ID N°27 correspondant a 1 • insert du 
vecteur p5A3 . 

Figure 28 ; 

La sequence d'acides amines telle que definie dans la 
figure 28 represente la sequence d'acides amines SEQ ID 
N°28 correspondant au polypeptide DP428. 



15 Figure 29 : 



La figure 29 represente la sequence nucleot idique SEQ ID N< 
29 du gene complet codant pour la proteine M1C25. 



2<> Figure 30 



La figure 30 represente la sequence d'acides amines SEQ ID 
N° 30 de la proteine M1C25. 



25 La ser ie de Figures 31 : 

La serie de Figures 31 represente la serie de sequences 
nucleotidiques SEQ ID N°31. 

30 La seri e de Figures 32 : 

La serie de Figures 32 represente la serie de sequences 
nucleotidiques SEQ ID N°32. 



35 La serie de Figures 33 
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La serie de Figures 33 represente la serie de sequences 
nucleotidiques SEQ ID N°33. 



La serip de Figures 34 

5 



It) 



La s<§rie de Figures 32 represente la s£rie de sequences 
nucleotidiques SEQ ID N°34 . 

La ser ie de Figures 35 - 

La serie de Figures 35 represente la serie de sequences 
nucleotidiques SEQ ID N°35. 



15 

La serie de Figures ifi • 

La serie de Figures 36 represente la serie de sequences 
nucleotidiques SEQ ID N°36. 

20 

La serie de Figures 37 : 

La serie de Figures 37 represente la serie de sequences 
nucleotidiques SEQ ID N°37. 



25 



30 



La ser ie de Figures 38 : 

La serie de Figures 38 represente la serie de sequences 
nucleotidiques SEQ ID N°38. 

La serie de Figures 39 : 



La serie de Figures 39 represente la serie de sequences 
nucleotidiques SEQ ID N°39. 

35 

La serie de Figures 40 : 
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La serie de Figures 40 represente la serie de sequences 
nucleotidiques SEQ ID N°40. 

La sgrie de Figures 41 : 

5 

La sSrie de Figures 41 represente la s£ne de sequences 
nucleotidiques SEQ ID N°41 correspondant a 1 ■ insert du 
vecteur p2D7 {depose a la CNCM sous le N°I-1821). 

10 La serie de Figures 47 : 

La serie de Figures 42 represente la serie de sequences 
nucleotidiques SEQ ID N°42. 



15 



La sgrie de Figures 4^ : 



La serie de Figures 43 represente la serie de sequences 
20 nucleotidiques SEQ ID N°43. 



La ser ie de Figures 44 



La serie de Figures 44 represente la serie de sequences 
25 nucleotidiques SEQ ID N°44 . 



La serie de Figures 4S » 



La serie de Figures 45 represente la serie de sequences 
30 nucleotidiques SEQ ID N°45. 



La serie de Figures 46 



La serie de Figures 46 represente la serie de sequences 
35 nucleotidiques SEQ ID N°46. 



La serie de Figures 47 
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La serie de Figures 47 represente la serie de sequences 
nucleotidiques SEQ ID N°47. 

5 La s6ri e de Figures 4R : 

La serie de Figures 46 represente la serie de sequences 
nucleotidiques SEQ ID N°48. 

10 La serie de Figures 49 : 

La serie de Figures 49 represente la serie de sequences 
nucleotidiques SEQ ID N°49. 
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La serie de Figures 50 



La serie de Figures 50 represente la serie de sequences 
nucleotidiques SEQ ID N°50. 



Figure 51 : 

A. la construction pJVED: Plasmid navette ( pouvant se 
multiplier chez l es mycobacteries ainsi que chez 
E.coli). avec un gene de resistance a la kanamycine 
(issu de Tn903) comme marqueur de selection. Le gene 
phoA tronque(A phoA) et le gene luc forment un operon 
synthetique . 

B. Sequence de la jonction entre phoA et luc. 
Figure. Si : 

Hybridation genomique (Southern blot) de l'ADN 
genomique de differentes especes mycobacteriennes a 
l'aide d'une sonde oligonucleotidique dont la sequence 
est la sequence comprise entre le nucleotide en 
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position nt 964 (extremite 5 • de la sonde) et le 
nucleotide en position nt 1234 (extremite 3' de la 
sonde), extremity indues, de la sequence SEQ ID N*l . 

5 Figures 53 et S4 : 

Activity Luc et PhoA de M . smegmatis recombinant: 
contenant le pJVED avec different fragments 
nucleotidiques comme decrits en exemple. Les figures 52 
'« et 53 representent les resultats obtenus pour deux 
experiences distinctes reaUsee, dans lea memes 
conditions . 



15 



20 



25 



30 



Figure R5 



Representation de 1 • hydrophobic^ (Kyte et Doolitle) 
de la sequence codante du polypeptide DP428 avec sa 
representation schematique. Le motif LPISG precede 
immediatement la region C-terminale hydrophobe. La 
sequence se termine par deux arginines. 

Figure 5K : 

Representation de 1 • hydrophoicitc (Kyte et Doolitle) de 
la sequence du polypeptide M1C25 de sequence d'acides 
amines SEQ ID N° 30. 

Figure 57 • 

A- Gel d'acrylamide (12%) en condition denaturante d • un 
extrait bacterien obtenu par sonication de bacteries E 
coli M15 contenant le plasmide P M1C25 sans et apres 4 
heures d' induction par l'IPTG, colore au bleu de 

35 Comassie. 
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ligne 1: Marqueur de masse molaire (Prestained SDS-PAGE 
Standards High Range BIO-RAD^). 

ligne 2: Extrait bacterien obtenu par sonication de 
* bact<§ries E. coli M15 contenant le plasmide P M1C25 

sans induction par l'IPTG. 

ligne 3: Extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide P M1C25 
apres 4 heures d' induction par l'IPTG. 

ligne 4: Marqueur de masse molaire (Prestained SDS-PAGE 
Standards Low Range BIO -RAD®) 



10 



15 



B- Western blot d'un gel semblable gel (acrylamide 12%) 
revele grace a l'anticorps penta-His commercialise par la 
societe Quiagen. 

20 ligne l: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards High Range BIO-RADttj. 

ligne 2: extrait bacterien obtenu par sonication de 
bacteries E. coli Mis contenant le plasmide P M1C25 
25 sans induction par l'IPTG. 

ligne 3: extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide P M1C25 
apres 4 heures d' induction par l'IPTG. 



30 



ligne 4: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards Low Range BIO-RAD®) 

La bande presente tres majoritairement dans les lignes 
35 correspondant aux bacteries induites par l'IPTG par rapport 
a celles non induites par l'IPTG, comprise entre 34200 et 
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28400 daltons, correspond a 1 'expression de 1 ■ insert M1C25 
clone dans le vecteur pQE-60 (Qiagen®) . 
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En ce qui concerne les ldgendes des autres figures qui 
sent numSrotSes par un caractere alphanum£rique , chacune de 
ces autres figures represents la sequence nucleot idique et 
la sequence d'acides amines de sequence SEQ id dont la 
numerotation est identique au caractere alphanumerique de 
chacune desdites figures. 

Les numerotations alphanumeriques des figures 
representant les SEQ ID comportant un no.bre suivi d'une 
lettre ont les significations suivantes : 

- les numerotations alphanumeriques presentant le meme 
nombre concernent une meme famille de sequence rattachees a 
la^ sequence de reference SEQ id dont la numerotation 
presente ce meme nombre et la lettre A 

- les lettres A, B et C pour une meme famille de sequences 
distinguent les trois phases de lecture possibles de 1 
sequence nucleotidique SEQ ID de reference (A) ,• 

- les lettres indexees par un prime (•) signifient que 1 
sequence correspond a un fragment de la sequence SEQ ID de 
reference (A) ■ 

- la lettre D signifie que la sequence correspond a la 
sequence du gene pr6dit par Cole et al., 1998 ; 

- la lettre F signifie que la sequence correspond a la 
phase ouverte de lecture (ORF pour "Open Reading Frame") 
contenant la sequence »D« correspondante d-apres Cole et 
al., 1998 ; 

- la lettre G signifie que la sequence est une sequence 
predite par Cole et al., 1998, et presentant une homologie 
de plus de 70% avec la sequence SEQ ID de reference (A) ; 

- la lettre H signifie que la sequence correspond a ' la 
phase ouverte de lecture contenant la sequence "G" 
correspondante d'apres Cole et al . , 199a • 

- la lettre R signifie que la sequence correspond a une 
sequence predite par Cole et al . , 1998, en amont de la 



a 



a 
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sequence "D" correspondante et pouvant etre en phase avec 
la sequence "D" en raison d'erreurs de sequencage 
possibles ; 

- la lettre P signifie que la sequence correspond a la 
phase ouverte de lecture contenant la sequence " R " 
correspondante ; 

- la lettre Q signifie que la sequence correspond a une 
sequence contenant les sequences »F" et » P " 
correspondantes . 

En ce qui concerne la famille de sequences SEQ ID N« 
4, 1' insert precedent phoA contient deux fragments non 
contigus sur le genome, SEQ ID 4J et SEQ ID 4A, et done 
issus d'un clonage multiple permettant 1' expression et 
1' exportation de phoA. Ces deux fragments non contigus, les 
genes et les phases ouvertes de lecture qui les contiennent 
d'apres Cole et al . , 1998, sont important pour 
1 'exportation d'un polypeptide antigene : 

- les lettres J, K et L distinguent les trois phases de 
lecture possibles de la sequence nucleotidique "J" 
correspondante ; 

- la lettre M signifie que la sequence correspond a la 
sequence predite par Cole et al . , 1998 , et contenant la 
sequence SEQ ID N° 4J ; 

- la lettre N signifie que la sequence correspond a la 
phase ouverte de lecture contenant la sequence SEQ ID N o 



4M 



N 



En ce qui concerne la famille de sequences SEQ id 
0 45, la lettre Z signifie que la sequence correspond a la 
sequence d'un fragment clone fusionne avec phoA. 

Enfin, en ce qui concerne la famille de sequence SEQ 
ID No 41, la lettre S signifie que la sequence correspond a 
une sequence predite par Cole et al . , 1998 et pouvant etre 
dans la meme phase de lecture que la sequence »D" 
correspondante, la lettre T signifiant que la sequence 
correspondante contient les sequences " F" et "S<> 
correspondantes . 
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EXEMPLKS 

Materiel et mdthodes 



5 Cultures bacteriennes , plasmides et milieux de cultures 

E. coli a ete- cultiv«5 sur milieu liquide ou solide Luria- 
Bertani (LB). M. smegma tia a ete cultive sur milieu liquide 
Middlebrook 7H9 (Difco) additxonne de dextrose albumine 

"0 (ADC) 0,2 % de glycerol et 0,05 % de Tween, ou sur milieu 
soUde L. Si necessaire, 1 - antibiotique kanamycine a ete 
rajoute a une concentration de 20 „g/ml- 1. Les clones 
bactenens prSsentant une activite PhoA ont ete detectes 
sur de 1'agar LB contenant du 5 -bromo-4 -chloro- 3 - indolyle 

15 phosphate (X-P, a 40 fig /ml- 1). 

Manipulation d'ADN et sequencage 

Les manipulations d'ADN et les analyses par 
20 Southern blot ont ete effectuees en utilisant les 
techniques standard (Sambrook et al., 1989). Les sequences 
d'ADN double brun ont ete determines avec un kit de 
sequencage Taq Dye Deoxy Termxnator Cycle (Applied 
Biosystems), dans un Systeme 9600 GeneAmp PC R (Perkin- 
» Elmer), et apres migration sur un systeme d'analyse ADN 
modele 373 (Applied Biosystems). 

Constructions des plasmides 



55 



Le plasmide pJVED a a ete construit a partir de 
pLA71 , plasmide de transfert comportant le gen e phoA 
tronque et place en phase avec BlaF. P LA71 a ete coupe avec 
les enzymes de restriction Kpnl e t Afotl , retirant ainsi 
phoA sans toucher le promoteur de BlaF. Le gene luc codant 
pour la luciferase de luciole a ete amplifie a partir de 
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PGEM-Iuc et un site de liaison du rzbosome a ete rajoute. 
phoA a ete amplifie a partir de pJEMll. Les fragments 
amplifies ont ete coupes avec PstI et ligatures ensemble. 
Les oligodeoxynucl^otides utilises sont les suivants : 
pPV.luc.Fw : 5 1 GACTGCTGCAGAAGGAGAAGATCCAAATGG3 1 
luc.Bw : 5 ' GACTAGCGGCCGCGAATTCGTCGACCTCCGAGG3 ' 
p JEM . phoA . Fw : 5 ' CCGCGGATCCGGATACGTAC3 1 
phoA . Bw : 5 • GACTGCTGCAGTTTATTTCAGCCCCAGAGCG3 • . 

Le fragment ainsi obtenu a ete ream P lif ie en 
utilisant les oligonucleotides complementaires de ses 
extremites, coupe avec Kpnl et Notl , et integre dans pLA71 
coupe avec les memes enzymes. La construction resultante a 
ete electroporee dans E. coli DH5a et M . swegwatis m C 2 155 . 
Un clone M. snegnatis emettant de la lumiere et presentant 
une activity phoA a ete selectionne et appele pJVED/bJaF. 
L ' insert a ete retire en utilisant BanMI et la construction 
refermee sur elle-meme, reconstruisant ainsi le pJVED 
Afin d'obtenir le pJVED b , c , le multisite de clonage 
coupe avec Seal et Kpnl et referme en enlevant un (pJVED b ) 
ou deux (pJVEDc) nucleotides du site SnaBI . Apres fusi 
six cadres de lecture ont P u ainsi etre obtenus . L ' insert 
du pJVED/hspia a ete obtenu par amplification en chalne par 
polymerase (ACP) de pPM1745 (Servant et al . , i 995 , en 
utilisant des oligonucleotides de la sequence : 
18.Fw : 5 1 GTACCAGTACTGATCACCCGTCTCCCGCAC3 1 
18. Back : AGTCAGGTACCTCGCGGAAGGGGTCAGTGCG3 1 

Le produit a ete coupe avec Kpnl et Seal, et 
ligature a P JVED a , coupe avec les memes enzymes, quittant 
ainsi le pJVED/hsplS. 

Le P JVED/P19kDa et le P JVED/erp furent construits en 
coupant avec BawRI 1 ■ insert de pEx P 410 et P Ex P 53 
respectivement, et en les inserant dans le site BarriKI du 



a- 
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multisite de clonage de pJVED a . 

Mesure de l'activite phosphatase alkaline 

La presence d'activite est detectee par la couleur 
bleue des colonies croissant sur un milieu de culture 
contenant le substrat 5-bromo 4-chloro 3-indolyl phosphate 
(XP), puis 1' activity peut etre mesuree quantitativement de 
maniere plus precise de la facon suivante : 

M. smegwatis ont 6te cultives dans un milieu LB 
additionnes de 0,05 % de Tween 80 (Aldrich) et de 
kanamycine (20 „g/ m i- 1) a 37 o C pendant 24 heures 
L'activite de la phosphatase alkaline a ete mesuree par la 
methode de Brockman et Heppel (Brockman et al., 1968) dans 
un extrait sonique, avec p-nitrophenylphosphate comme 
substrat de la reaction. La quantite de proteines a ete 
mesuree par essai Bio-Rad. L'activite phosphatase alkaline 
est exprimee en unite arbitraire (densite optique a 420 nm 
x /xg de proteines- 1 x minutes- 1) . 

Mesure de l'activite lucif erase 

M. smegwatis a ete cultive dans un milieu LB 
additionne de 0,05 % de Tween 80 (Aldrich) et de kanamycine 
(20 M g/ml- 1) a 37°C pendant 24 heures et utilise en pleine 
croissance exponentielle (DO a 600 nm comprise entre 0,3 et 
0,8). Les aliquots de suspensions bacteriennes ont ete 
brievement soniqueg et 1' extrait cellulaire a ete utilise 
pour mesurer l'activite de la lucif erase. 25 M l de 
1' extrait sonique ont ete melanges avec 100 M l de substrat 
(systeme d'essai luciferase Promega) automatiquement dans 
un luminometre et la lumiere emise exprimee en ULR ou RLU 
(Unit6s Lumineuses Relatives). Les bacteries ont ete 
comptees par dilutions serielles de la suspension d'origine 
sur milieu agar LB kanamycine et l'activite de la 
luciferase exprimee en ULR/ M g de proteines bacteriennes ou 
en ULR/103 bacteries. 
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Construction de banques genomiques de M. tuberculosis et 
de M. bovis -BCG 



Les banques ont ete obtenues en utilisnnt 
essentiellement P JVED a , b(C precedemment decrits. 

Preparation de macrophages issus de la moelle osseuse et 
infection par M. smegmatis recombinants 



Les macrophages issus de la moelle osseuse ont ete 
prepares comma decrits par Lang et al., 1991 . En r6sume 
les cellules de la moelle osseuse ont ete preleves du femur 
de souris C57BL/6 agee de 6 a 12 semaines (Iffa-Credo 

13 France). Les cellules en suspensions ont ete lavees et 
resuspendues dans du DMEM enrichi avec 10 % de serum foetal 
de veau, 10 % de milieu L-cell conditionne et 2 mM de 
glutamine, sans antibiotiques . i 0 6 cellules ont ete 
ensemencees sur des plaques 24 puits Costar a fond plat 

2« dans l ml. Apres quatre jours a 37<>c dans une atmosphere 
humide a 10 % de teneur en C02 , les macrophages ont ete 
nnces et reincubes pendant deux a quatre jours 
supplemental^. Les cellules d ■ un puits controle ont ete 
lysees avec du triton x 100 a o,l % dans 1 ■ eau et les 

25 noyaux enumeres . Environ 5 x i 0 5 cellules adherentes ont 
ete comptees. Pour !■ infection, M. snegnatis portant les 
differents plasmides a ete cultive en pleine phase 
exponentielle (DO 600 nm entre 0,4 et 0,8) et dilue jusqu'a 
une DO de 0,1 puis io fois dans un miUeu pour macroohage 

30 1 ml a ete ajoute a chaque puits et les plaques ont ete 
centnfugees et incubees quatre heures a 37°c. Apres trois 
lavages, les cellules ont ete incubees dans un milieu 
contenant de 1 ■ amykacine pendant deux heures. Apres trois 
nouveaux lavages, les cellules infectees adherentes ont ete 

35 incubees dans un milieu macrophage pendant une nuit. Les 
cellules ont ensuite ete lysees dans 0,5 ml de tampon de 
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lyse (Promega) . 100 M l ont ete soniques et la lumiere emise 
a ete mesuree sur 25 „m. Simultanement , les bacteries ont 
ete enumerees par etalement sur L-agar-kanamycine (20 
/^g/ml- 1). La lumiere emise est exprimee en ULR/103 
5 bacteries. 

Analyses des banques de donnees 

Les sequences nucl6otidiques ont ete comparees a 
H) EMBL et GenBank en utilisant 1'algorithme FASTA et les 
sequences proteiques ont ete analysees par similitude 
grace aux banques de donnees PIR et Swiss Prot en utilisant 
1'algorithme BLAST . 



Exemple 1 : Les vecteurs pJVED 

Les vecteurs pJVED (Figure 51) sont des plasmides 
portant un gene phoA tronque de E. coli depourvu de codon 
d' initiation, de sequence S1 gnal et de sequence 
regulatrice. Le site multiple de clonage (SMC) permet 
1' insertion de fragments des genes codants pour 
d'eventuelles proteines exportees ainsi que leurs sequences 
de regulation. Des lors. la proteine de fusion peut etre 
produite et presenter une activite phosphatase alcaline si 
elle est exportee . Seules les fusions en phase pourront 
etre productives. Ainsi, le SMC a ete modifie de sorte que 
les fusions peuvent etre obtenues dans six phases de 
lecture. En aval de phoA, le gene luc de la lucif erase de 
luciole a ete insere. Le gene complet avec le codon 
d' initiation mais sans qu'aucun promoteur n'ait ete utilise 
devrait ainsi s'exprimer avec phoA comme dans un operon 
synthetique. Un nouveau site de liaison des ribosomes a ete 
insere huit nucleotides en amont du codon d • initiation de 
luc. Deux terminateurs transcriptionnels sont presents dans 
les vecteurs pJVED, un en amont du SMC et un second en aval 
de luc. Ces vecteurs sont des plasmides de transfert E. 
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coli-mycobacterium avec un gene de resistance a 1 
kanamycine comme marqueur de selection. 
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phoA et luc fonctionnent comme dans un opSron 
5 1 'exportation est nScessaire pour l'activit4 phoA. 

Quatre plasmides ont ete construits par inserti 
dans le SMC de fragments d'ADN d'origine diverse : 

Dans la premiere construction nommee pJVED/blaF, le 
fragment de 1,4 kb provient du plasmide deja decrit pLA71 
10 (Lim et al., 1995). Ce fragment i SS u du gene P -lactamase 
tblaF) de M. fortuitum D216 (Timm et al . , 1994) inclut le 
promoteur mute hyperactif, le segment codant pour 32 acides 
amines de la sequence signal et les 5 premiers acides 
amines de la proteine mature. Ainsi cette construction 
15 inclut le promoteur le plus fort connu chez mycobacterium 
et les elements necessaires a 1 • exportation de la proteine 
de la fusion phoA. Par consequent, on peut attendre de 
cette construction une forte emission de lumiere et une 
bonne activity phoA (cf figures 53 et 54) . 

20 Dans une deuxieme construction nommee pJVED/hsplfi, 

un fragment de 1,5 kb a ete clone a partir du plasmide de D a 
decrit pPM1745 (Servant et al . , 19 95). Ce fragment inclut 
les nucleotides codants pour les dix premiers acides amines 
de la proteine de choc thermique de 18 kb issue de 

25 Streptomycea albus (heat shock protein 18, HSP 18), le site 
de liaison du ribosome, le promoteur et, en amont, des 
sites regulators controlant son expression. Cette proteine 
appartient a la famille de alpha-crystalline de HSP a 
faible poids moleculaire (Verbon et al . , i 992 ) son 

30 homologue issu de M. leprae. 1'antigene de 18 kDa, est deja 
connu pour etre induit durant la phagocytose par un 
macrophage murin de la lignee cellulaire j-774 
(Dellagostinet al . , 1995). Dans des conditions de culture 
standard, le P JVED/hspl8, montre une faible activite Juc et 

35 aucune activite phoA (cf figures 53 et 54) 
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Dans une troisieme construction, nommee 
PJVED/ Pl9kDa, 1 • insert issu de P Exp410 (Lim et al . , 1995) a 
ete coupe et clone dans le SMC de pJVED a . Ce fragment 
mclut lea nucleotides codants pour les 134 premiers acxdes 
amines de la proteine connue de M. tuberculosis 19 kDa et 
de ses sequences regulatrices . Comme cela a pu etre mis en 
Evidence, cette proteine est une lipoproteine glycosylee 
(Garbe et al . , 1993 ; Herrmann et al., 1996) . Sur les 
fxgures 53 et 54, on observe, pour cette construction, une 
bonne activite luc correspondant a un promoteur fort, mais 
1« activite phoA est la plus forte des quatre constructions. 
L'activite ph oA elevee de cette proteine de fusion avec une 
lipoproteine s-explique par le fait qu'elle reste attachee 
a la paroi cellulaire par son extremite N- terminal. 

Dans la quatrieme et derniere construction nommee 
pJVED/erp 1 ■ insert provient de P Exp53 (Lim et al., 1995) e t 
a ete clone dans le SMC de p JVED a . pE xp53 est le plasmide 
initial selection^ pour son activite phoA et contenant une 
partie du gene erp de m. tuberculosis qui code pour un 
antigene de 28 kDa. Ce dernier inclut la sequence signal 
une partie de la proteine mature et, en amont du codon 
d' inflation, le site de liaison de ribosome. Le promoteur 
a ete cartography . Une bolte fer (iron box) putative du 
type fur est presente dans cette region et encadre la 
region -35 du promoteur (Berthet et al . , 199 5) . Comme 
prevu (fig Ures 53 et 54) cette construction presente une 
bonne emission lumineuse et une bonne activite phoA . Le 
fait que cette proteine de fusion, contrairement a la 
fusion avec la lipoproteine de 19 kDa, ne semble pas 
attachee a la paroi cellulaire n'exclut pas que la proteine 
native y soit associee. De plus, 1'extremite C-terminal de 
erp est absente de la proteine de fusion. 

Example 2 : Construction d'une banque d 1 ADN genomique de 
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tuberculosis dans les vecteurs pJVED s et identification 
d'un des membres de ces banques, (DP428). induit au cours 
de la phagocytose par les macrophages murins derives de la 
moelle osseuse. 

Les differentes constructions sont testees pour 
leur capacite a evaluer 1' expression intracellular des 
genes identifies par 1- expression de phoA. Dans cet 
objectif, l'activite 2uc est exprimee en URL pour i 0 3 
bacteries en culture axenique et/ou dans des conditions 
intracellulars. L' induction ou la repression suivant la 
phagocytose par les macrophages murins derives de la moelle 
osseuse peut etre evaluee convenablement par la mesure des 
activites specif iques. Les resultats de deux experiences 
distinctes sont presentes dans le tableau 2. 

Le plasmide pJVED/hsplS a ete utilise comme 
controle positif pour 1' induction durant la phase de 
croissance intracellular . Bien que 1 • induction du 
promoteur par le chauffage de la bacterie a 42°C n'ait pas 
ete concluant la phagocytose de la bacterie conduit 
clairement a une augmentation de 1- activity du promoteur. 
Dans toutes les experiences, l'activite luc intracel lulaire 
a ete fortement induite, augmentant de 20 a 100 fois 
l'activite basale initialement faible (Servant, 1995). 

Le plasmide pJVED/MaF a ete utilise comme controle 
de la modulation non specif ique au cours de la phagocytose. 
De faibles variations ont p U etre mises en evidence 
probablement dues a des changements de conditions de 
cultures. Quoi qu'il en soit, ces faibles variations ne 
sont pas comparables a 1- induction observee avec le 
plasmide pJVED/hsplS. 

Tous les membres de la banque d'ADN ont ete testes 
par mesure de l'activite du promoteur durant la croissance 
intracellular. Parmi eux, le DP428 est fortement induit 
au cours de la phagocytose {tableaux l et 2) . 
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TABLEAU 1 



10 



15 



Construction 



pJVEDth /aF- 



pJVED//;.v/ ;/,V_ 



pJVED//J/V2<V 



Construction 



pJVED/b/af 



pJVED/ksp/S 



pJVED/D/V2tS' 



% Recuperation 



0,5 



0.6 



URL/10 1 
bacterics 
cxtraccllulaire 



1 460 



0.7 



% Recuperation 
C57BL/6 Balb/C 



1. 1 



8 



0,06 



URL/ 1 a' 
bacterics 
intr accllulairc 
1727 



57 



18 



URL/10 1 
bacterics 
cxtraccllulaire 



6,7 



1.7 



1.6 



2.1 



662 



164 
0.08 



URL/10 3 
bacterics 
intraccllulairc 
C57BL/6 Balb/C 



250 



911 



261 



325 



1.25 



3.3 



Induction 



1.2 



7.1 



300 



Induction 
C57BL/6 Balb/C 



0,4 



1.4 



1,6 



15.6 



41 



TABLEAU 2 



Construction 


% Recuperation 


URL/10 1 


URL/10 1 


Induction 






bacterics 


bacterics 






cxtraccllulaire 


intraccllulairc 




pJVED/A/a/-^ 


22 


1477 


367 


0,25 


p}VED/hsp/8 
pJVED/D/V25 


7 
21 


0,26 
0,14 


6,8 
4 


26 
28 



Le fragment nucleotidique codant pour la region N- 
terminale du polypeptide DP428 de sequence SEQ ID N° 28 est 
contenu dans le plasmide depose a la CNCM sous le N» i- 
1818. 

La totalite de la sequence codant pour le polypeptide 
DP428 a ete obtenue comme detaillee ci-apres. 

Une sonde a ete obtenue par PGR a 1 ■ aide des 
oligonucleotides de sequence SEQ ID N° 25 et SEQ ID N» 26. 
Cette sonde a ete marquee par extension aleatoire en 
presence de » P dCTP. Une hybridation de 1 ' ADN genomique de 
M. tuberculosis souche Mtl03 prealablement digere par 
l'endonuclease Seal a ete realisee a 1-aide de ladite 
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sonde. Les resultats de 1 ■ hybridation ont fait apparaitre 
qu'un fragment d'ADN d'environ 1,7 kb etait marque. Du fait 
qu-il existe un site Seal s'etendant du nucleotide nt 984 
au nucleotide nt 989 de la sequence SEQ ID N° 1 e'est-a- 
5 dire du cote 5' de la sequence utilise comme sonde, la fin 
de la sequence codante est n6cessairement presente dans le 
fragment detecte par hybridation. 

L'ADN genomique de la souche Mt 103 de M. 
tuberculosis, apres digestion par Seal, a subi une 
10 migration sur un gel d'agarose. Les fragments de tallies 
comprises entre 1,6 et 1,8 kb ont ete clones dans le 
vecteur pSLUBO (Pharmacia) prealablement clive par Seal et 
dephosphoryle . Apres transformation de E. coli avec les 
vecteurs recombinants resultants, les colonies obtenues ont 
15 ete criblees a 1'aide de la sonde. Le criblage a permis 
d'isoler six colonies hybridant avec cette sonde. 

Les inserts contenus dans les plasmides des clones 
recombinants prec6demment selectionnes ont ete sequences 
puis les sequences alignees de maniere a determiner la 
2" totalxte de la sequence codant pour DP428, plus 
specif iquement la SEQ id N" 2. 

Un couple d'amorces a ete synthetise afin d'amplifier 
a partir de 1-ADN genomique de M. tuberculosis, souche Mt 
103, la totalite de la sequence codant pour le polypeptide 
25 DP428. L-amplicon obtenu a ete clone dans un vecteur 
d' expression. 

Des couples d'amorces appropries pour 1 ■ ampl if ication 
et le clonage de la sequence codant pour le polypeptide 
DP428 peuvent etre aisement realises par 1 - homme du metier 
30 sur la base des sequences nucleotidiques SEQ ID N°l et SEO 
ID N°2. 

Un couple d'amorces particulier selon 1- invention est 
le couple d'amorces suivants, capable d'amplifier 1 ' ADN 
codant pour le polypeptide DP428 depourvu de sa sequence 
35 signal : 
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- Amorce aller (SEQ ID N° 29), comprenant la sequence 
allant du nucleotide en position nt 1021 au nucleotide nt 
1044 de la sequence SEQ ID N° 2 : 
5 1 - AGTGCAT GCTGCTGGCCreA ACCATCAnrnfl r . 3 < 

- Amorce retour (SEQ ID M<" 30 ) , comprenant la sequence 
complementaire de la sequence allant du nucleotide en 
position nt 1345 au nucleotide en position nt 1325 de la 
sequence SEQ ID N° 2 : 

5' -CAGCCAGATCTGCGGGCGCrrTrcr&rrnrv^ 3 , ( 

dans lesquelles la partie soulignee represente les 
sequences hybridant specif iquement avec la sequence SEQ ID 
N° 2 et les extremites 5' correspondent a des sites de 
restriction en vue du clonage de 1'amplicon resultant dans 
un vecteur de clonage et/ou d ■ expression . 

Un vecteur particulier utilise pour !■ expression du 
polypeptide DP428 est le vecteur pQE70 commercialise par la 
sociSte Qiagen. 

Exemple 3 : La sequence complete du gene DP428 et de ses 
regions flanquantes. 

Une sonde de la region codante de DP4 28 a ete 
obtenue par ACP, et utilisee pour hybrider 1 ' ADN genomique 
de differentes especes de mycobacteries. D'apres les 
resultats de la figure 3, le gene est present uniquement 
dans les mycobacteries du complexe de M. tuberculosis. 

L-analyse de la sequence suggere que DP428 pourrait 
30 faire partie d^un operon. La sequence codante et les 
regions flanquantes ne presentent aucune homologie avec des 
sequences connues deposees dans les banques de donnees. 

D-apres la sequence codante, ce gene code pour une 
proteine de 10 kDa avec un peptide signal, une extremite C- 
35 termxnal hydrophobe terminee par deux arginines et precedee 
par un motif LPISG semblable au motif connu LPXTG . Ces deux 
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arginines pourraient correspondre a un signal de retention 
et la proline DP428 pourrait etre accrochee par ce motif a 
des peptidoglycanes comme cela a d<§ja £te decrit chez 
d'autres bact<§ries Gram' (Navarre et al . , 1994 e t 1996). 

Le mScanisme de survie et de croissance 
intracellulaire des mycobactSries est complexe et les 
relations intimes entre la bacterie et la cellule hoce 
restent inexpliquees . Quel que soit le m<Scanisme, la 
croissance et la survie intracellulaire des mycrobacteries 
depend de facteurs produits par la bacterie et capables de 
moduler la reponse de 1'hote. Ces facteurs peuvent etre des 
molecules exposees a la surface cellulaire telle que LAM ou 
des proteines associees a la surface cellulaire, ou des 
molecules activement secrStees. 

D'un autre cote, intracel lulairement , les bacteries 
elles-memes doivent faire face a un environnement hostile. 
Elles semblent y repondre par des moyens proches de ceux 
mis en oeuvre dans les conditions de stress, par 
1' induction de proteines de choc thermique (Dellagostin et 
20 al., 1995), mais aussi par induction ou la repression de 
differentes proteines (Lee et al . , 1995). En utilisant une 
methodologie derivee de la PCR, Plum et Clark-curtiss (Plum 
et al., 1994) ont montre qu'un gene de M. avium inclu dans 
un fragment d ' ADN de 3 kb, est induit apres la phagocytose 
par des macrophages humains. Ce gene code pour une proteine 
exportee comprenant une sequence leader mais ne presentant 
pas d'homologie significative avec les sequences proposees 
par les banques de donnees. L'induction, pendant la phase 
de croissance intracellulaire, d'une proteine de choc 
thermique de faible poids moleculaire issue de M. leprae a 
egalement ete mise en Evidence (Dellagostin et al., 1995). 
Dans une autre etude, les proteines bacteriennes de M. 
tuberculosis ont ete metaboliquement marquees pendant la 
phase de croissance intracellulaire ou bien dans des 
conditions de stress et separees par electrophorese sur gel 
a deux dimensions : 16 proteines de M. tuberculosis ont ete 
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induites et 28 reprimees. Les memes proteines sont mises en 
jeu au cours de stress provoque par un faible pH, un choc 
thermique, H 2 0 2 , ou au cours de la phagocytose par des 
monocytes humains de la lignee THP1 . Quoi qu'il en soit, le 
comportement des proteines induites et reprimees etait 
unique dans chaque condition (Lee et al., 1995). Pris 
ensemble, ces resultats indiquent qu'un dialogue 
moleculaire subtile est mis en place entre les bacteries et 
leurs notes cellulaires. De ce dialogue depend probablement 
le sort de l'organisme intracellulaire . 

Dans ce contexte, 1' induction de 1' expression de 
DP428 pourrait etre d'une importance majeure, indiquant un 
role important de cette proteine dans la survie et la 
croissance intracellulaire. 
'5 La methode utilisee dans ces experiences pour 

evaluer 1' expression intracellulaire des genes (cf. Jacobs 
et al., 1993, pour la methode de determination de 
1' expression de la luciferase de luciole. et Lim et al . , 
1995, pour la methode de determination de 1- expression du 
20 gene PhoA) presente l'avantage d'etre simple comparee aux 
autres techniques comme la technique decrite par Mahan et 
al. (Mahan et al . , 1993) adaptee aux mycobacteries et 
proposee par Bange et al . (Bange et al., 1996), ou la 
methode substractive basee sur l'ACP decrite par Plum et 
25 Clark-curtiss (Plum et al . , 1994). u existe 
indiscutablement une variability comme le montre la 
comparaison des differentes experiences. Bien que provoquer 
1' induction ou la repression soit suffisant, il est 
desormais possible de 1- evaluer fournissant ainsi un outil 
supplemental d' etudes physiologiques des proteines 
exporters identifiees par fusion avec phoA. 



30 



Exemple 4 



Recherche d'une modulation de l'activite des promoteurs 
35 lors des phases intramacrophagiques . 
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Des macrophages de moelle osseuse de souris sont 
prepares comme decrit par Lang et Antoine (Lang et al . , 
1991). Les bacteries de M. segmentis recombinantes , dont on 
a determine l'activite lucif erase par 10 3 bact6ries comme 
precedemment, sont incubees a 37°C sous atmosphere 
humidifiee et enrichie en C0 2 a 5%, pendant 4 heures en 
presence de ces macrophages de telle maniere qu'elles 
soient phagocytees. Apres rincage pour eliminer les 
bacteries extracellulaires restantes, on ajoute au milieu 
de culture de 1 ■ amikacine (100 M g/ml) pendant deux heures. 
Apres un nouveau rincage, le milieu est remplace par un 
milieu de culture (DMEM enrichi de 10 % de serum de veau et 
2 mM de glutamine) sans antibiotiques . Apres une nuit 
d' incubation comme precedemment , les macrophages sont lyses 
a froid (4°C) a l'aide d'un tampon de lyse (cee lysis 
buffer, Promega), et l'activite luciferase par 10 3 
bacteries determinee. Le rapport des activites a 1 
culture et apres une nuit donne le coefficient d'inducti 



a mise en 
on . 



Exemple 5 : 

Isolement d'une serie de sequences par sequencage 
directement a partir des colonies. 

Une serie de sequences permettant 1- expression et 
25 1- exportation de phoA ont ete isolees a partir de 1 ' ADN de 
M. Tuberculosis ou de M. Bovis BCG. Parmi ce groupe de 
sequences, deux d'entre elles ont ete d • avantage etudiees, 
lea genes entiers correspondant aux inserts ont ete clones! 
sequences, et des anticorps contre le produit de ces genes 
30 ont servi a montrer en microscopie electronique que ces 
genes codaient pour des antigenes retrouves a la surface 
des bacilles de la tuberculose. L ■ un de ces genes erp 
codant pour une sequence signal d ' exportation consensus, 
1' autre des ne possedait aucune caracteristique de gene 
35 codant pour une proteine exportee, d- apres la sequence. Un 
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autre gene DP428 a ete sequence avant que la sequence du 
genome de M. Tuberculosis ne soit disponible. II contient 
une sequence ressemblant a la sequence consensus 
d'attachement au peptidoglycane, ce qui suggere qu'il 
s'agit aussi d'un antigene vraisemblablement retrouve a la 
suface des bacilles de la tuberculose. L 1 etude des trois 
genes erp, des, et celui codant pour DP428 montre que le 
systeme phoA que nous avons developpe chez les 
mycobacteries permet de reperer des genes codant pour des 
proteine exportees sans determinant reperable par des 
etudes in silica. Ceci est particulierement vrai pour les 
polypeptides qui ne possedent pas de sequence signal 
consensus (des) ou non pas de similarity avec des proteines 
de fonction connue (erp et DP428) 



Un certain nombre d 1 inserts ont ete identifies et 
sequences avant la connaissance du genome de M. 
Tuberculosis, d'autres apres. Ces sequences peuvent etre 
considerees comme des amorces permettant de rechercher des 
genes codant pour des proteines exportees. A ce jour, une 
serie d' amorces ont ete sequencees et les genes entiers 
correspondants ont ete soit sequences, soit identifies 
d- apres la sequence publiee du genome. Pour tenir compte 
des erreurs de sequencage toujours possibles, les regions 
25 en amont ou en aval de certaines amorces ont ete 
considerees comme pouvant faire partie de sequences codant 
pour des proteines exportees. Dans certains cas des 
similarity avec des genes codant pour des proteines 
export6es ou des sequences caracteristiques de signaux 
d' exportation ou des caracteristiques topologiques de 
proteines membranaires ont ete detectees. 

Des sequences amorces s'averent correspondre a des 
genes appartenant a des families de genes possedant plus de 
35 50 % de similarity. On peut ainsi indiquer que les autres 
genes detectes par similarity avec une amorce codent pour 
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des proteines exportees. C'est le cas de la sequence SEQ ID 
N° 8G et SEQ ID N° 8H possedant plus de 77 % de similarity 
avec SEQ ID N° 8A' . 

Les sequences pouvant coder pour des proteines 
exportees sont les suivantes : SEQ ID N° 1, 8, 9, 8G, 8H 
13, 3, 10, 19, 20, 6, 16, 22, 23, 24, 39, 44, 46, et 50. 

Des genes identifies d'apres les amorces a partir de 
la sequence du genome n'ont aucune caracteristique (d'apres 
la sequence) de proteines exportees. il s'agit des 
sequences suivantes : SEQ ID N' 4, 27, n, 12, 14, 7 15 
17, 18, 21, 31, 32, 33, 34, 35, 36, 37, 38, 40, 41, 42, 43,' 
45, 47, 48, et 49. 

D'apres la sequence d'autres organismes comme E . coli, 
on peut rechercher dans la sequence du genome de M. 
tuberculosis, des genes possedant des similarity avec des 
proteines connues pour etre exportees chez d'autres 
organismes bien que ne possedant pas de sequence signal 
d- exportation. Dans ce cas une fusion avec phoA est un 
protocole avantageux pour determiner si ces sequences de M. 
tuberculosis cedent pour des proteines exportees bien que 
ne presentant pas de sequence signal consensus. Il a ete en 
effet possible de doner SEQ ID N° 49, une sequence 
similaire a un gene de E. coli de la famille htrA. Une 
fusion de SEQ ID N° 49 avec phoA conduit a 1' expression et 
a 1' exportation de phoA. Des colonies M. smegmatis 
hebergeant une fusion SEQ ID N' 4 9 phoA sur un plasmide 
pJVED sont bleues. 

SEQ ID N° 4 9 est done consideree comme une proteine 
exportee . 

La methode phoA est done utile pour detecter d'apres 
la sequence de M. Tuberculosis des genes codant pour des 
proteines exportees sans qu'ils ne cedent pour des 
sequences caracteristiques des proteines exportees. 
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Meme si une sequence possede des determinants de 
proteines exportees, cela ne dSmontre pas une exportation 
fonctionnelle. Le systeme phoA permet de montrer que le 
gene suspect^ code r£ellement pour une prot<§ine export£e . 
Ainsi, il a £t£ v£rifi£ que la sequence SEQ ID N° 50 
poss£dait bien des signaux d ' exportation . 



TABLEAU 3 



SEQ ID N° 


Reference de la 
sequence 

correspondante predite 
par Cole et al. 




Annotation 


SEQ ID N°l 


Rv 0203 




Sequence hydrophobe en 
N- terminal 


SEQ ID N°4 
SEQ ID N°27 


Rv 2050 




Pas de prediction 


SEQ ID N°8 
SEQ ID N°9 


Rv 2563 


* 


Proteine membranaire 


SEQ ID N° 
8G f , H' 


Rv 0072 


* 


Possible proteine de 
transport transmembranai re 
de type ABC 


SEQ ID N°ll 


Rv 0546c 


ML 


Protein S-D Lactoyl 
Glutathione-methyl 
glyoxal lyase 


SEQ ID N°12 


pas de prediction 




non retrouve dans 
M. tuberculosis H37rv 


oLy ID N 1J 
SEQ ID N°3 
SEQ ID N°10 


Rv 1984c 




probable pr£curseur 
cutinase avec une sequence 
signal N-terminale 


SEQ ID N°14 
SEQ ID N°7 


pas de prediction 




pas de prediction 


SEQ ID N°15 


avec decalage de 
lecture, pourrait etre 
en phase avec Rv 2530c 




pas de prediction 


SEQ ID N°17 


Rv 1303 


ML 


pas de prediction 


SEQ ID N°18 


Rv 0199 


ML 


pas de prediction 


SEQ ID N°19 


Rv 0418 


+ 


site de fixation de lipo- 
proteine membranaire 
procaryote, similarite avec 
la N-acetyl puromycyne 
acetyl hydrolase 


SEQ ID N°20 
SEQ ID N°6 


Rv 3576 


* 


contient un site de 
fixation de lipoproteine 
membranaire procaryote, 
similarite avec une 
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serine/threonine proteine 
k i na se 


SEQ ID N° 21 
~ 


Rv 3365c 


Ml 

- . - . _ 


similarit6 avec unc metallo 
peptidase a zinc 

pas de prediction 


SEQ ID N°31 


non pr6ditc 






SEQ ID N°32 


Rv 0022c 


ML 


Existence d'une region 
consensus avec la f ami lie 
d r ac 


SEQ ID N°33 


Rv 104 4 




pas de prediction 


SEQ ID N°34 


non predite 




pas de prediction 


SEQ ID N°35 


Rv 2169c 




pas de prediction 


SEQ ID N°36 


Rv 3909 


ML 


pas de prediction 


SEQ ID N°37 


Rv 2753c 




similarite avec des 

fi l huHrnnr i ^/"\ 1 -i n -1 hr. 
ui.i lyuiupi lCOllndCe 

synthases 


SEQ ID N°38 


Rv 0175 




pas de prediction 


SEQ ID N°39 


Rv 3006 


ML 


ptcuitiiufi ae sequence 
signal de lipoproteine 


SEQ ID N°40 


Rv 0549c 




pas de prediction 


SEQ ID N°41 


Rv 2975c pouvant etre 
en phase avec Rv 2974c 




iiiniidrite avec proteine de 
substilis 


SEQ ID N°42 


Rv 2622 




similarite avec une methyl 


SEQ ID N°43 


Rv 3278c 


ML 


pas de prediction 


SEQ ID N°44 


Rv 0309 


* 


pas de prediction 


SEQ ID N°45 


Rv 2169c 


MT 

I ILi 


pas de prediction 


SEQ ID N°46 


Rv 1411c 


+ 


probable lipoproteine 
avec une sequence signal 
N-terminale 


SEQ ID N°47 


Rv 1714 




similarite avec une 
gluconate 3-dphvHrArtpn3ca 


SEQ ID N°48 


Rv 0331 




similarite avec une sulfide 
dehydrogenase et une 
sulfide quinone reductase 


SEQ ID N°49 


Rv 0983 


ML 


Similarite avec une serine 
protease HtrA 



WO 99/09186 



PCT/FR98/01813 



94 











SEQ ID N°5 








SEQ ID N°16 


Rv 3010 


ML 


Proteine dc surface 
Do r the 1c t ct al. 199b 


SEQ ID N°22 
SEQ ID N°23 
SEQ ID N°24 


Rv 3763 


Conticnt un site de 
fixation do lipoproteins 
membranaire eucaryote 


SEQ ID N°50 


Rv 0125 


* 


Site actif des serines 
prot6ases 

Sequence signal N-terminale 
possible 



Legende du tableau 3 : 

Correspondance des sequences selon 1' invention avec les 
sequences predites par Cole et al . 1998, Nature, 393, 537- 
5 544. 

* : Prediction que la proteine codee par la sequence 

soit exportee 
ML : Prediction de similarity avec M. leprae. 

10 Exemple 6 : 

Caracteristiques et obtention de la proteine M1C25 



15 



20 



L'extremite N terminale de la proteine M1C25 a ete 
detectee par le systeme PhoA comme permettant 1 ' exportation 
de la proteine de fusion, necessaire a 1' obtention de son 
activite phosphatase. 

La sequence d'ADN codant pour l'extremite N terminale de 
la proteine M1C25 est contenue dans la sequence SEQ ID N° 
20 de la presente demande de brevet. 

A partir de cette sequence amorce, le gene complet 
codant pour la proteine M1C25 a ete recherche dans le 
genome de M . tuberculosis (Fondation Welcome Trust, site 
Sanger) , 

Le centre Sanger a attribue a M1C25 les noms : 
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Rv3576, 
MTCY06G11 . 23 , 
pknM 

Sequence SEP TO N° 29 rin gene cnmnlet M1C25 (714 ban**) : 
cf. Figure 29 

Ce gene code pour une proteine de 237 AA, de 25 kDa de 
masse molaire. Cette proteine est referenc6e dans les 
banques sous les appellations: 
PID:e306716 , 
SPTREMBL : P96858 

Sequence SEQ TD N° 30 de U proteins M1C25 (711 acide* 
15 amines) : cf . Figure 30 

M1C25 contient un site de fixation a la partie 
lipidique des lipoproteines de membrane des procaryotes 
(PS00013 Prokaryotic membrane lipoprotein lipid attachment 
20 site: 

CTGGTCGGTG CGTGCATGCT CGCAGCCGGA TGC) . 

La fonction de M1C25 n'est pas certaine mais elle 
possede tres probablement une activite "serine/threonine- 
proteine kinase". Des ressemblances sont a noter avec la 
25 moitie C terminale de K08G_MYCTU Q11053 Rvl266c 
(MTCY50.16). Des similarites sont aussi retrouvees avec 
KY28_MYCTU. 

En 5' du gene codant pour M1C25 se trouve un gene 
codant potentiellement pour une proteine regulatrice 
(PID:e306715, SPTREMBL : P96857 , Rv3575c, (MTCY06G11 . 22c) ) 

Le profil d'hydrophobicite (Kyte et Doolitle) de M1C25 
est reprdsente a la figure 56. 

Un site de clivage de la sequence signal est predit 
(SignalP VI . l ; World Wide Web Prediction Server, Center for 
Biological Sequence Analysis) entre les acides amines 31 et 
32: AVA-AD . Ce site de coupure est derriere un motif " AX A" 
classique. Cette prediction est compatible avec le profil 



30 



35 
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d' hydrophobicite . Dans cette sequence signal potentielle il 
est a remarquS la repetition trois fois de la sequence des 
trois acides amines LAA. 



Clonage du gene M1C25 en vue de la production de la 
protSine qu'il code: 

Un couple d'amorces a 6tS synth6tis£ afin d'amplifier, 
a partir de l'ADN genomique de M. tuberculosis, souche 
H37Rv, la totality de la sequence codant pour le 
polypeptide M1C25. L'amplicon obtenu a ete clone dans un 
vecteur d 1 expression . 



20 



Des couples d' amorces appropries pour 1 ' amplification 
5 et le clonage de la sequence codant pour M1C25 ont ete 
synth6tises : 
-amorce aller : 

5 1 - AT AAT ACC A TGGG C AAG C AG CT AG CCG CG C - 3 ' 
-amorce retour : 

5' - ATTT AT AG ATCTCTG CTT AGC AACCTTGGCCG CG - 3' 



La partie soulignee represente les sequences hybridant 
specif iquement avec la sequence M1C25 et les extremites 5' 
correspondent a des sites de restriction en vue du clonage 
25 de l'amplicon resultant dans un vecteur de clonage et/ou 
d' expression. 

Un vecteur particulier utilise pour 1' expression du 
polypeptide M1C25 est le vecteur pQEGO commercialise par la 
societe Qiagen, en suivant le protocole et les 
30 recommendations proposes par cette marque. 

Les cellules utilises pour le clonage sont des 
bacteries : E. coli XLl-Blue (resistante a la 
tetracycline) . 

Les cellules utilisees pour 1' expression sont des 
35 bacteries : E. coli M15 (resistante a la kanamycine) 
contenant le plasmide pRep4 (M15 pRep4 ) 
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La production de la proteine MC25 est illustree par les 
figures 57 A et B. ( Extraits bacteriens de la souche E . 
coli M15 contenant le plasmide pMlC25. Les cultures 
bact£riennes et les extraits sont prepares selon Sambrook 
et al. (1989). L'analyse des extraits bacr£riens est 
effectu£e selon les instructions de Quiagen (1997). 
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REVEND I CATIONS 
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30 



1. Vecteur recombinant de criblage, de clonage et/ou 
d'expression, caract6ris6 en ce qu'il se replique chez des 
mycobacteries et en ce qu'il contient : 

1) un r^plicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 

3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 

b) eventuellement un terminateur de transcription actif 
chez les mycobacteries, en amont du polylinker, 

c) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'expression, d ' exportat ion et/ou 
de secretion de proteine, ladite sequence nucleotidique 
etant depourvue de son codon d' initiation et de ses 
sequences de regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus 
dans le meme fragment, ladite sequence nucleotidique etant 
pourvue de son codon d ' initiation . 



2. Vecteur recombinant selon la revendication l, 
caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'expression, 
25 d'exportation et/ou de secretion de proteine est une 
sequence codante issue du gene phoA de la phosphatase 
alcaline . 



3. Vecteur recombinant selon 1 ' une des revendications 1 et 
2, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'expression 
d'exportation et/ou de secretion de proteine est une 
sequence codante du gene de la p-agarase, de la nuclease 
d'un staphylocoque ou de la (3-lactamase d ' une mycobacterie . 
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4. Vecteur recombinant selon l'une des revendications 1 a 

3, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 
codante issue du gdne luc de la lucifSrase de luciole. 

5. Vecteur recombinant selon l'une des revendications 1 a 

4, caracterise en ce que la sequence nucl6ot idique codante 
issue d'un gene codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 
codante issue du gene GFP de la Green Fluorescent Protein. 

6. Vecteur recombinant selon l'une des revendications 1 a 

5, caractSrise en ce que le terminateur de transcription 
actif chez les mycobacteries est le terminateur du 
coliphage T4 (tT4) . 

7. Vecteur recombinant selon l'une des revendications 1 a 

6, caracterise en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM (Collection Nationale 
de Cultures de Microorganismes , Paris, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, 
le 12/12/1996, 

b) pJVEDb depose a la CNCM sous le N° 1-1906, le 25 juillet 
25 1997, 

c) pJVEDc deposS a la CNCM sous le N° 1-1799, l e 
12/12/1996. 
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8. Vecteur recombinant selon l'une des revendications 1 a 
7, caracterise en ce qu'il comprend en 1 • un des sites de 
clonage du polylinker une sequence d'acide nucieique de 
mycobacterie chez laquelle on detecte un polypeptide 
susceptible d'etre exporte et/ou secrete, et/ou d'etre 
induit ou reprime lors de 1' infection par ladite 
35 mycobacterie ou encore exprime ou produit de facon 
constitutive, ainsi que les sequences promotrices et/ou 
regulatrices associees susceptibles de permettre ou de 
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favoriser 1 ■ exportation et/ou la secretion dudit 
polypeptide, ou tout ou partie de gene codant pour ledit 
polypeptide . 



9. Vecteur recombinant selon 1 ' une des revendicat ions 1 a 

8, caract6ris£ en ce que la sequence d'acide nucl£ique de 
mycobacterie qu'il contient est obtenue par fragmentation 
physique ou par digestion enzymatique de l'ADN gSnomique ou 
de l'ADN compl<§mentaire d 1 un ARN d ' une mycobacterie. 

10. Vecteur recombinant selon 1 1 une des revendications 1 a 

9, caracterise en ce que ladite mycobacterie est M. 
tuberculosis . 



11. Vecteur recombinant selon 1 1 une des revendications 1 a 
9, caracterise en ce que ladite mycobacterie est choisie 
parmi M. africanum, M. bovis, M. avium ou M. leprae. 



12. Vecteur recombinant selon la revendicat ion 10, 
20 caract<§ris<§ en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM : 

a) p6D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1814 , 

b) P 5A3 deposS le 28 janvier 1997 a la CNCM sous le N°I- 
25 1815, 

O p5F6 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1816, 

d) p2A29 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1817, 

30 e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1819, 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
35 1820, 

h) p2D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1821, 
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i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I- 
1843, 

j)pJVED/M. tuberculosis depos<§ le 25 juillet 1997 a la 
CNCM sous le N° 1-1907, 
5 k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n°I-2062. 

13. Vecceur recombinant selon la revendication 12, 
caract<§ris£ en ce qu'il s'agit du plasmide pDP428 depose le 
28 janvier 1997 a la CNCM sous le N°I-1818. 

10 

14. Procede de criblage de sequences de nucleotides issues 
de mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 
pouvant etre induits ou reprimes lors de 1' infection, leurs 

15 sequences promotrices et/ou regulatrices associees 
susceptibles notamment de permettre ou de favoriser 
^exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caracterise en ce qu'il met en oeuvre 

20 un vecteur selon 1 1 une des revendications 1 a 13. 

15. Procede de criblage selon la revendication 14, 
caracterise en ce qu'il comprend les etapes suivantes : 

a) la fragmentation physique des sequences d'ADN de 
25 mycobacteries ou leur digestion par au moins une enzyme 

determinee et la recuperation des fragments obtenus ; 

b) 1' insertion des fragments obtenus a l'etape a) dans un 
site de clonage, compatible le cas Scheant avec 1 ' enzyme de 
l'etape a), du polylinker d'un vecteur selon 1 • une des 

30 revendications 1 a 13 ; 

c) si besoin, 1 ■ amplification desdits fragments contenus 
dans le vecteur, par exemple par replication de ce dernier 
apres insertion du vecteur ainsi modifie dans une cellule 
determinee, de preference E coli ; 

35 d) la transformation de cellules notes par le vecteur 
amplifie a l'etape c) , ou en 1 ' absence d ' amplification, par 
le vecteur de l'etape b) ; 
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e) la culture de cellules notes transf ormees dans un milieu 
permettant la mise en evidence du marqueur d ' exportation 
et/ou de secretion, et /ou du marqueur d'activite de 
promoteurs contenu dans le vecteur ; 

f) la detection des cellules hotes positives (colonies 
positives) pour 1 'expression du marqueur d • exportation 
et/ou de secretion, et /ou du marqueur d'activite de 
promoteurs ; 

g) l'isolement de l'ADN des colonies positives et 
1' insertion de cet ADN dans une cellule identique a celle 
de 1' etape c) ; 

h) la selection des insertions contenues dans le vecteur, 
permettant l'obtention de clones positifs pour le marqueur 
d' exportation et/ou de secretion, et /ou pour le marqueur 
d'activite de promoteurs ; 

i) l'isolement et la caracterisat ion des fragments d'ADN de 
mycobacteries contenues dans ces inserats, et 1 'etape i) du 
procede pouvant comporter en outre une etape de sequencage 
des insertions selectionnees . 



16. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie, caracterisee en ce qu'elle est obtenue par 
un procede selon la revendicat ion 14 et/ou un procede 
comprenant les etapes a) et b) , ou a) , b) et c) du procede 

25 selon la revendication 15. 

17. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 16, caracterisee en 
ce que ladite mycobacterie est une mycobacterie pathogene. 

18. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 17, caracterisee en 
ce que ladite mycobacterie est une mycobacterie appartenant 
au groupe du complexe Mycobacterium tuberculosis. 
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19. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 18, caracterisee en 
ce que ladite mycobacterie est Mycobacterium tuberculosis. 

5 20. Sequence nucleotidique de mycobacterie ou comprenant 
une sequence nucleotidique de mycobacterie susceptible 
d'etre selectionnee par un procede selon 1 1 une des 
revendications 14 et 15. 



K) 



15 



20 



25 



30 



35 



21. Sequence nucleotidique de mycobacterie ou comprenant 
une sequence nucleotidique de mycobacterie selon la 
revendication 20, caracterisee en ce que ladite 
mycobacterie est choisie parmi M. tuberculosis, M. bovis, 
M. africanum, M. avium, M. leprae, M. paratuberculosis , M. 
kansassi ou M. xenopi . 

22. Sequence nucleotidique selon 1 1 une des revendications 
20-21 caracterisee en ce qu'elle est choisie parmi les 
sequences de fragments d'ADN de mycobacterie de sequence 
nucleique SEQ ID N°l a SEQ ID N° 24C, SEQ ID N°27A a SEQ ID 
N°27C, SEQ ID N°29 et SEQ ID N° 31A a SEQ ID N°50F. 

23. Sequence nucleotidique de mycobacterie 1 ■ une des 
revendications 20-21 caracterisee en ce qu'elle est choisie 
parmi les sequences de fragments d'ADN de mycobacterie de 
sequence SEQ ID N°l, SEQ ID N°3A, SEQ ID N°SA, SEQ ID N°6A, 
SEQ ID N°7A, SEQ ID N°8A, SEQ ID N°9A, SEQ ID N°10A, SEQ ID 
N°27A ou SEQ ID N°29 contenus respectivement dans les 
vecteurs pDP428 (CNCM, N°I-1818), p6D7 (CNCM, N°I-1814), 
P5F6 (CNCM, N'I-1816), p2A29 (CNCM, N°I-1817), p5 B5 (CNCm! 
N°I-1819) ,plC7 (CNCM, N°I-1820), P 2D7 ( CNCM ,N°I-1821) ', 
P 1B7(CNCM, N-I-1843), p5A3 (CNCM, N°I-1815) et P M1C25 
(CNCM, N°I-2062) . 

24. Sequence nucleotidique comprenant la totalite du cadre 
ouvert de lecture d'une sequence selon 1 1 une quelconque des 
revendications 20 a 23. 
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25. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est complementaire de 
5 la sequence d ' un polynucleotide selon l'une des 

revendications 20 a 24, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon l'une des 
revendications 20 a 24, 

10 c) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon l'une 
des revendications 20 a 24, 

d) un fragment d * au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon l'une des revendications 20 a 
15 24 ou defini en a) . 



26. Polypeptide, leurs fragments ou fragments 
biologiquement actifs ou leurs polypeptides homologues, 
susceptible d'etre code par une sequence nucleotidique de 
mycobacterie selon l'une des revendications 20 a 25, et 
susceptible d'etre exporte et/ou secrete, et/ou induit ou 
reprime, ou exprime de fagon constitutive lors de 
1 ' infection . 



27. Mycobacterie recombinante 
est transformee par un vecteur 
revendications 1 a 13 . 



caracterisee en ce qu'elle 
recombinant selon l'une des 



28. Polynucleotide dont la sequence est choisie parmi les 
sequences nucieot idiques de sequence SEQ ID N°l a SEQ ID 
N°2 . 



29. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucieot idiques SEQ ID N°l a SEQ ID N°2 / 
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b) un polynucleotide dont la sequence nucleique est la 
sequence comprise entre le nucleotide en position nt 964 et 
le nucleotide en position nt 1234 , extremites indues, de 
la sequence SEQ ID N°l, 

O un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) , c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) . 



30. Polynucleotide selon 1 • une des revendications 20 a 25, 
28 et 29, caracterise en ce que sa sequence nucleique 
hybride avec 1'ADN de sequence de mycobacteries et 
preferentiellement avec de 1 ' ADN de sequences de 
mycobacteries appartenant au complexe de Mycobacterium 

20 tuberculosis . 

31. Polypeptide caracterise en ce qu'il est code par une 
sequence polynucleotidique selon 1 ■ une des revendications 
20 a 25 . 



32. Polypeptide caracterise en ce qu'il comprend un 
polypeptide choisi parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d-acides amines SEQ ID N° la SEQ ID N° 24C 
SEQ ID N o 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide defini en a), 

O un fragment d'au moins 5 acides amines d'un polypeptide 
defini en a) ou b) , 

d) un fragment biologiquement actif d'un polypeptide defini 
en a) , b) , ou c) . 
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33. Polypeptide dont la sequence d'acides amines est 
comprise dans la sequence d'acides amines SEQ ID N°l ou SEQ 
ID N°2, ou polypeptide de sequence d'acides amines SEQ ID 
N°28 . 

34. Polynucleotide caracterise en ce qu'il code pour un 
polypeptide selon l'un des revendicat ions 32 et 33. 

35. Sequence d'acide nucleique utilisable comme amorce, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences d'acide nucleique de polynucleotide selon 
I'une des revendicat ions 20 a 25, 28 a 30, et 34. 

36. Sequence d'acide nucleique selon la revendicat ion 35, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences SEQ ID N°25 et SEQ ID N°26. 

37. Sequence d'acide nucleique selon 1 ' une des 
20 revendications 35 et 36 pour la detection et/ou 

1 * amplification de sequences nucleiques. 

38. Sequence d'acide nucleique utilisable comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences d'acide nucleique selon I'une des 
revendications 20 a 25, 28 a 30, et 34. 

39. Sequence d'acide nucleique selon la revendicat ion 38, 
caracterisee en ce qu'elle est marquee par un compose 
radioactif ou par un compose non radioactif. 



15 



25 



30 



40. Sequence d'acide nucleique selon I'une des 

revendications 38 et 39, caracterisee en ce que celle-ci 

est immobilisee sur un support, de maniere covalente ou 
35 non-covalente. 
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41. Sequence d'acide nucleique selon 1 ' une des 
revendications 38 a 40 pour la detection et/ou 
1 ' amplification de sequences nucleiques. 

42. Sequence d'acide nucleique selon l'une des 
revendications 38 a 41, caracterisee en ce que ladite 
sequence est une sequence comprise entre le nucleotide en 
position nt 964 et le nucleotide en position nt 1234, 
extremity indues, de la sequence SEQ ID N°l. 

43. Vecteur recombinant de clonage, depression et/ou 
d- insertion , caracterise en ce qu'il contient une sequence 
d'acide nucleique de polynucleotide selon l'une des 
revendications 20 a 25, 28 a 30, et 34. 

44. Cellule hote, caracterisee en ce qu'elle est 
transforms par un vecteur recombinant selon la 
revendication 43. 



20 45. Cellule hote selon la revendication 44 , caracterisee en 
ce qu'il s'agit de la souche de E . coli transformee par le 
plasmide pDP428 depose le 28 janvier 1997 a la CNCM sous le 
N°I-1818 ou transformee par le plasmide P M1C25 depose le 
4 aoGt 1998 a la CNCM sous le n°I-2062, ou d ' une souche de 

25 M. tuberculosis, M. bovis ou M. africanum possedant 
potentiellement tous les systemes de regulation appropries. 

46. Prodde de preparation d'un polypeptide, caracterise en 
ce qu'il met en oeuvre un vecteur selon la revendication 

.30 4 3. 

47. Polypeptide recombinant susceptible d'etre obtenu par 
un procede selon la revendication 46. 

35 48. Polypeptide hybride, caracterise en ce qu'il comporte 
au moins la sequence d'un polypeptide selon l'une des 
revendications 26, 32, 33 et 47 et une sequence d'un 
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polypeptide susceptible d'induire une reponse immunitaire 
chez 1 1 homme ou 1' animal. 

49. Polypeptide hybride selon la revendication 48, 
5 caracterise en ce que le polypeptide susceptible d'induire 
une reponse immunitaire contient au moins un determinant 
antigenique capable d'induire une reponse humorale et/ou 
cellulaire . 



K) 



15 



20 



25 47 
b) 



50. Polynucleotide codant pour un polypeptide hybride selon 
l'une des revendications 48 et 49. 

51. Polypeptide hybride selon l'une des revendications 48 
et 49, caracterisee en ce qu'il s'agit d'une proteine 
recombinante obtenue par 1' expression d'un polynucleotide 
selon la revendication 50. 

52. Procede pour la detection in vitro d'anticorps diriges 
contre une mycobacterie et pref erentiellement une bacterie 
du complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact de 1 ' echantillon biologique avec un 
polypeptide selon l'une des revendications 26, 32, 33 et 



mise en evidence du complexe antigene-anticorps forme. 



53. Procede pour la detection d'une infection par une 
mycobacterie et pref erentiellement une bacterie du complexe 
30 Mycobacterium tuberculosis dans un mammifere, caracterise 
en ce qu'il comprend les etapes suivantes : 

a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 
du systeme immunitaire dudit mammifere et plus 
35 particulierement encore des cellules T ; 
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b) incubation de 1 ' echant illon biologique de l'etape a) avec 
un polypeptide selon l'une quelconque des revendicat ions 
26, 32, 33 et 47 ; 

c) detection d'une reaction cellulaire indiquant une 
sensibilisation pr<§alable du mammifere audit polypeptide 
notamment la proliferation cellulaire et/ou la synthese de 
prolines telles que 1' interferon gamma; 

d) detection d'une reaction d ' hypersensibilite retardee ou 
de sensibilisation du mammifere audit polypeptide. 

54. Kit pour le diagnostic in vitro d'une infection par une 
mycobacterie appartenant au complexe Mycobacterium 
tuberculosis , comprenant : 

a) un polypeptide selon l'une des revendicat ions 26, 32, 33 
15 et 47 ; 

b) le cas echeant, les reactifs pour la constitution du 
milieu propice a la reaction immunologique; 

Oles reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique ; 

d) le cas echeant, un echantillon biologique de reference 
(temoin negatif) depourvu d'anticorps reconnus par ledit 
polypeptide ; 

e) le cas echeant, un echantillon biologique de reference 
(temoin positif) contenant une quantite predSterminee 
d'anticorps reconnus par ledit polypeptide. 

55. Anticorps mono- ou polyclonaux, leurs fragments, ou 
anticorps chimdriques, caracterises en ce qu'ils sont 
capables de reconnaitre specif iquement un polypeptide selon 
l'une des revendicat ions 26, 32, 33 et 47 

56. Anticorps selon la revendicat ion 55, caracterise en ce 
qu'il s'agit d'un anticorps marque. 

57. Procede pour la detection specif ique de la presence 
d'un antigene d'une bacterie du complexe Mycobacterium 



20 



25 
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tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les Stapes suivantes : 

a) mise en contact de 1 ' echant il Ion biologique avec un 
anticorps selon l'une des revendications 55 et 56 ; 

b) mise en Evidence du complexe antigene-anticorps forme. 

58. Kit pour la detection specif ique de la presence d'un 
antigene d'une bact6rie du complexe Mycobacterium 
tuberculosis dans un Echantillon biologique, caracterise en 
ce qu'il comprend les elements suivants : 

a) un anticorps polyclonal ou monoclonal selon l'une des 
revendications 55 et 56 ; 

b) les reactifs pour la constitution du milieu propice a la 
reaction immunologique ; 

O les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique. 



59. Procede de detection et d- identification rapide d'une 
mycobacterie et pref erentiellement de M . tuberculosis dans 
un echantillon biologique, caracterise en ce qu'il 
comporte les etapes suivantes : 

a) isolement de l'ADN a partir de 1 • echantillon biologique 
a analyser, ou obtention d'un ADNc a partir de l'ARN de 
1 1 echantillon biologique ; 
25 b) amplification specif ique de l'ADN des mycobactSries 
appar tenant au complexe Mycobacterium tubercuiosis a 
l'aide d' amorces selon l'une des revendications 35 a 37 ; 
c) analyse des produits d ' amplification . 

30 60. Procede pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique selon 
35 l'une des revendications 38 a 42 avec un echantillon 
biologique, l'ADN contenu dans 1 ' echantillon biologique 
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ayant, le cas echeant, prealablement ete rendu accessible a 
1 ' hybridation, dans des conditions permettant 1 ' hybridat ion 
de la sonde a l'ADN d ' une bactdrie du complexe 
Mycobacterium tuberculosis ; 

b) detection de 1 ' hybride £orm£ entre la sonde 
oligonucleotidique et l'ADN de 1 ' <§chantillon biologique. 

61. Procede" pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique 
immobilisee sur un support selon la revendicat ion 40 avec 
un echantillon biologique, l'ADN de 1 1 echantillon, ayant, 
le cas echeant, ete prealablement rendu accessible a 
1' hybridation, dans des conditions permettant 
1' hybridation de la sonde a l'ADN d'une bacterie du 
complexe Mycobacterium tuberculosis ,■ 

b) mise en contact de 1' hybride forme entre la sonde 
oligonucleotidique immobilisee sur un support et l'ADN 
contenu dans 1 ' echant illon biologique, le cas echeant 
apres elimination de l'ADN de 1 ' echantillon biologique 
n' ayant pas hybride avec la sonde, avec une sonde 
oligonucleotidique marquee selon la revendicat ion 39. 

62. Procede de detection selon la revendication 61, 
caracterise en ce que, prealablement a l'6tape a), l'ADN de 
1' echantillon biologique, ou l'ADNc obtenu par 
transcription inverse de l'ARN de 1 ' echantillon , est 
amplifie a l'aide d'un couple d' amorces selon 1 ' une des 
revendications 3 5 a 37. 



63. Procede pour la detection de la presence d'une bacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 
35 un echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 
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a) mise en contact de 1 ' echantillon biologique avec un 
couple d'amorces selon 1 1 une des revendicat ions 35 a 37, 
l'ADN contenu dans 1 ' Echantillon ayant Ete, le cas echeant, 
prealablement rendu accessible a 1 ' hybridation , dans des 

5 conditions permettant une hybridation des amorces a l'ADN 
d'une bactErie du complexe Mycobacterium tuberculosis ; 

b) amplification de l'ADN de la bactErie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 • amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par 
exemple par Electrophorese sur gel ou au moyen d'une sonde 
oligonuclEotidique marquee selon la revendicat ion 39. 



15 



64. Procede pour la detection de la presence d'une bacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 

un echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 

a) mise en contact de 1 ' Echantillon biologique avec deux 
couples d'amorces selon l'une des revendicat ions 35 a 37, 

20 l'ADN contenu dans 1 ' echant i 1 Ion ayant Ete, le cas 
Echeant, prealablement rendu accessible a 1 ' hybridation, 
dans des conditions permettant une hybridation des amorces 
a l'ADN d'une bactErie du complexe Mycobacterium 
tuberculosis ; 

b) amplification de l'ADN de la bacterie du complexe 
Mycobacterium tuberculosis ; 

c) mise en evidence de 1 ' amplification de fragments d'ADN 
correspondant au fragment encadre par lesdites amorces, par 
exemple par Electrophorese sur gel ou au moyen d'une sonde 
oligonuclEotidique marquee selon la revendicat ion 39. 



25 



30 



65. Kit pour la detection de la presence d'une bacterie du 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les elements 
35 suivants : 
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a) une sonde oligonucleotidique selon 1 ' une des 
revendications 38 a 42 ; 

b) les reactifs necessaires a la mise en oeuvre d ' une 
reaction d 1 hybridation ; 

5 c) le cas echeant, un couple d' amorces selon 1 1 une des 
revendications 35 a 37 ainsi que les reactifs necessaires 
a une reaction d ' amplif ication de 1 ' ADN (ADN genomique, 
plasmidique ou ADNc) d'une bacterie du complexe 
Mycobacterium tuberculosis . 

10 

66. Kit ou necessaire pour la detection de la presence 
d'une bacterie du complexe Mycobacterium tuberculosis dans 
un echantillon biologique, caracterise en ce qu'il comprend 
les elements suivants : 
15 a) une sonde oligonucleotidique, dite sonde de capture, 
selon la revendicat ion 40 ; 

b) une sonde oligonucleotidique, dite sonde de revelation, 
selon l'une des revendications 38 a 42 ; 

c) le cas echeant, un couple d' amorces selon l'une des 
20 revendications 35 a 37 ainsi que les reactifs necessaires 

a une reaction d ■ amplification de 1 • ADN d'une bacterie du 
complexe Mycobacterium tuberculosis . 



25 



67. Kit pour 1 ' amplification de 1 ' ADN d'une bacterie du 
complexe Mycobacterium tuberculosis present dans un 
echantillon biologique, caracterise en ce qu'il comprend 
les elements suivants : 

a) un couple d' amorces selon l'une des revendications 35 a 
37 ; 

30 b) les reactifs necessaires pour effectuer une reaction 
d' amplification d ' ADN ; 

c) eventuellement un composant permettant de verifier la 
sequence du fragment amplifie, plus part iculierement une 
sonde oligonucleotidique selon l'une des revendications 38 
35 a 42. 
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68. Composition immunogene caracterisee en ce qu'elle 
comprend un ou plusieurs polypeptides selon l'une des 
revendications 26, 32, 33 et 4 7 et/ou un ou plusieurs 
polypeptides hybrides selon 1 ' une des revendications 48, 49 
et 51. 

69. Vaccin caracteris6 en ce qu'il contient un ou plusieurs 
polypeptides selon 1 1 une des revendications 26, 32, 33 et 
47 et/ou un ou plusieurs polypeptides hybrides selon l'une 
des revendications 48, 49 et 51, en association avec un 
vehicule pharmaceut iquement compatible et, le cas echeant 
un ou plusieurs adjuvants de l'immunite appropries. 

70. Vaccin destine a 1 ' immunisation a 1 ■ encontre d'une 
infection bacterienne ou virale, telle que la tuberculose 
ou 1' hepatite, comprenant un vecteur selon la revendicat ion 
43 ou un polynucleotide selon la revendicat ion 50, en 
association avec un vehicule pharmaceut iquement acceptable. 

71. Vaccin caracterise en ce qu'il contient une ou 
plusieurs sequences nucleot idiques selon l'une des 
revendications 20 a 24 et/ou un ou plusieurs 
polynucleotides selon la revendicat ion 25 en association 
avec un vehicule pharmaceutiquement compatible et, le cas 
echeant, un ou plusieurs adjuvants de l'immunite 
appropries . 

72. Methode de criblage de molecules capables d'inhiber 
la croissance de mycobacter ies ou le maintien de 
mycobacteries dans un hote, caracterisee en ce que lesdites 
molecules bloquent la synthese ou la fonction des 
polypeptides codes par une sequence nucleot idique selon 
l'une quelconque des revendications 20 a 24 ou par un 
polynucleotide selon la revendicat ion 25. 
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73. M<§thode de criblage selon la revendication 72, 
caracterisee en ce que les molecules sont des anti- 
messagers ou induisent la synthese d ' anti -messagers . 

74. Molecules capables d'inhiber la croissance de 
mycobacteries ou le maintien de mycobacteries dans un hote, 
caracterisees en ce que lesdites molecules sont 
synth6tisees d'apres la structure des polypeptides codes 
par une sequence nucleotidique selon l'une quelconque des 
revendications 20 a 24 ou par un polynucleotide selon 

la revendication 25. 
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TTC 
F 


GCT 
A 


GGC 
G 


TAT 
Y 


44 4 
107 


445 
108 


TTG 
L 


TCG 
S 


CAG 
Q 


TAG 
+ 


CGCGACGGCATTGTCG ATG TCT TGG TAC 
M S W * 


3 CTAGCATCCGGTCGGGGGGCCGCTACCAGCG 515 

4 


516 


CCAGCGCCGGGGCTCCCCGGTCCGGGTAGTGCGCGTCGAGTTGGTCGTGGACCAGCA ATG ACT GCG ACC CGG 


537 


1 






























M 


T 


A 


T 


R 




5 


588 
6 


CGA 
R 


CTT 
L 


CGA 
R 


AAC 
N 


CGC 
R 


CAC 
H 


CGG 
R 


TTA 
L 


GAT 
D 


TCC 
S 


CCG 
P 


ACT 
T 


GCG 
A 


TCA 

S 


TCG 
S 


CCA 
P 


GGT 
G 


AAA 
K 


CCG 
p 


CCG 
? 


647 
25 


648 
26 


GCA 
A 


CTA 
L 


ACG 
T 


CCA 

P 


GCA 
A 


ACC 
T 


AAC 
N 


CCG 
P 


TGA 
+ 


AGACCAACCA^CGGCACCTGCGCAGGTTGCGGCTCAACCGCATC 


718 
34 


719 
1 


ATG 
M 


AAC 
N 


TGC 
C 


TGG 
W 


ATT 
I 


TCG 
S 


GAC 
D 


TCC 
S 


CCG 
P 


TAC 
Y 


TCT 
S 


CGC 
p 


GCA 
A 


GTG 

V 


CGT 

D 


GCC 
A 


CGC 
R 


GAG 


CCT 
P 


ACC 
T 


773 
20 


779 
21 


GAA 
E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC 
R 


AC A 


GCA 
A 


CCT 
p 


GGA 
G 


GTT 
V 


GGC 
G 


GGC 
G 


GCC 
A 


GAG 
E 


838 
40 


839 
41 


GGC 
G 


CGA 
R 


GAT 

D 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
D 


CGT 
R 


CGG 
R 


GGG 


CGG 
r 


GAA 


L 


CCA 
? 


GGC 
G 


CGC 
R 


CGG 
R 


ACC 
T 


GTC 
V 


S9S 
60 


899 
61 


GCA 
A 


AAC 
K 


CCG 
p 


TCG 

S 


CAA 
Q 


ACC 


CGT 
R 


CGC 
R 


AAA 

K 


CCG 

P 


TAA 


GGAGTCATCC ATG AAG ACA GGC ACC GCG 
M K T G T A 


^5 9 


960 
7 


ACG 
T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG 
L 


TTG 
L 


GCA 
A 


GTA 
V 


CTG 
L 


ATC 
I 


GCC 
A 


CTC 
L 


GCG 
A 


TTG 


CCG 
P 


GGG 
G 


GCC 
A 


GCC 
A 


GTT 
V 


1019 

2-; 


020 
27 


GCG 
A 


CTG 
L 


CTG 
L 


GCC 
A 


GAA 

IT 


CCA 
P 


TCA 
S 


GCG 
A 


ACC 
T 


GGC 
G 


GCG 
A 


TCG 

c 


GAC 
D 


CCG 
p 


TGC 


GCG 
A 


GCC 
A 


AGC 
5 


GAA 


GTG 
V 


•>"i79 


080 
47 


GCG 
A 


AGG 
R 


ACG 
T 


GTC 
V 


GGT 
G 


TCG 
5 


GTC 

V 


GCC 
A 


AAG 

K 


TCG 

S 


ATG 

Vf 


GGC 
G 


GAC 

D 


V 


CTG 
L 


GAT 

D 


TCA 

S 


CAC 
H 


CCA 
p 




1139 

6 o 


140 
67 


ACC 
T 


AAC 
N 


CAG 
Q 


GTG 

V 


ATG 
M 


ACC 
T 


GCG 
A 


GTC 
V 


TTG 

L 


CAG 
Q 


CAG 
0 


CAG 

n 


GTA 


GGG 


CCG 
p 


GGG 


TCG 
S 


GTC 


GCA 


TCG 


1 199 

3 


200 


CTG 


AAG 
K 


GCC 


CAT 
H 




GAG 


GCG 
A 


AAT 


CCC 

p 


AAG 
K 


GTC 


GCA 

;\ 


TCG 


GAT 














100 



SEQ ID N° 1 



FIGURE 1 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



2/185 



Insert 


du 


-lone contenant 


DP428 


et contenu 


dans seal 












1/1 


















31/11 


















GAT CGC 


CTT 


TGA 


CGC 


CTA 


TTC 


GGT 


CGC 


GCA 


GCT TTT 


TGG 


CGA 


CGT 


CAC 


TGG 


TGC 


CCG 


CGT 


asp arg 
61/21 


leu 


OPA 


arg 


leu 


phe 




arg 


aj, a 


al a phe 
91/31 


trp 


arg 


arg 


his 


trn 
Lt F 


cya 


pro 


arg 


TGC GGG 


CGT 


CCA 


GCC 


GCA 


GCG 


ACA 


CCA 


CAT 


ACG GCC 


GGT 


CCG 


GTT 


GCG 


GGG 


GCC 


GTT 


GGG 


cys gly 


arg 


oro 


ala 


ala 


ala 


thr 


pro 




t-h r ala 
i-ili did 


gly 


pro 


val 


ala 


al v 


ala 


val 


gly 


121/41 


















151/51 














TGG GGT 


TGG 


GTG 


CCT 


CCG 


TCA 


CCC 


CAG 


GCA 


GTT CGC 


TGG 


CTA 


TTT 


GTC 


GCA 


GTA 


GCG 


CGA 


trp gly 


trp 


val 






ser 


pro 


gin 


ala 


val arg 


trp 


leu 


»_ v. rt 

pne 


val 


al a 


val 


ala 


arg 


181/61 


















211/71 
















CGG CAT 


TGT 


CGA 


TGT 


CTT 


GGT 


AGC 


TAG 


CAT 


CCG GTC 


GGG 


GGG 


CCG 


CTA 


CCA 


GCG 


CCA 


GCG 


arg his 


cys 


arg 


CVS 


leu 


crl v 


3er 


AMB 


his 


pro val 


gly 


gly 


pro 


leu 


pro 


ala 


pro 


ala 


241/81 


















271/91 














CCG GGG 


CTC 


CCC 


GGT 


CCG 


GGT 


AGT 


GCG 


CGT 


CGA GTT 


GGT 


CGT 


GGA 


CCA 


GCA 


ATG 


ACT 


GCG 


pro gly 


leu 


pro 


cil V 




crl v 


ser 


al a 


arg 


arg val 


gly 


arg 


gly 


oro 


ala 


met 


thr 


ala 


301/101 


















331/111 








ACC CGG 


CGA 


CTT 


CGA 


AAC 


CGC 


CAC 


CGG 


TTA 


GAT TCC 


CCG 


ACT 


GCG 


TCA 


TCG 


CCA 


GGT 


AAA 


thr arg 


arg 


leu 


arg 


asn 


ara 


his 


ara 


leu 


asp ser 


pro 


LI li 


ala 

a JL a 


ser 


ser 


pro 


gly 


1 vs 


361/121 


















391/131 












CCG CCG 


GCA 


CTA 


ACG 


CCA 


GCA 


ACC 


AAC 


CCG 


TGA AGA 


CCA 


ACC 


AAC 


GGC 


ACC 


TGC 


GCA 


GGT 


pro pro 


ala 


leu 


thr 


pro 


ala 


thr 


asn 


pro 


OPA a rrr 


pro 


t-h r 


asn 


gly 


thr 


cys 


ala 


gl y 


421/141 


















45 1/151 












TGC GGC 


TCA 


ACC 


GCA 


TCA 


TGA 


ACT 


GCT 


GGA 


TTT CGG 


ACT 


CCC 


PPT 


ACT 


CTC 


GCG 


CAG 


TGC 


cys gly 


ser 


thr 


ala 


ser 


OPA 


thr 


ala 


yx y 


rih a ttt 
£ji ic a jl y 


thr 


pro 


arg 


thr 


leu 


ala 


gin 


cys 


481/161 


















511/171 












GTG CCC 


GCG 


AGC 


CTA 


CCG 


AAG 


ATC 


GCG 


TGC 


ATG CGT 


TCG 


GCG 




ACC 


GCA 


CAG 


CAC 


CTG 


val pro 


ala 


ser 


leu 


Dro 


1 vs 


ile 


al a 


CVS 


rne t arg 


ser 


al a 
did 


trp 


thr 


al a 


gin 


his 


leu 


541/181 


















571/191 
















GAG TTG 


GCG 


GCG 


CCG 


AGG 


GCC 


GAG 


ATG 


GCA 


GGA TGA 


CGG 


ATC 


GTC 


GGG 


GGC 


GGG 


AAC 


TCC 


glu leu 


ala 


ala 


oro 


arg 


ala 


glu 


rne t 


ala 


gly OPA 


arg 


•i 1 - 

i x e 


vai 


crl v 


al v 


gly 


asn 


ser 


601/201 


















631/211 












CAG GCC 


GCC 


GGA 


CCG 


TCG 


CAA 


ACC 


CGT 


CGC 


AAA CCC 


GTC 


GCA 


AAC 


CGT 


AAG 


GAG 


TCA 


TCC 


gin ala 


ala 


ol V 


pro 


ser 


gin 


thr 


ar g 


arg 


lys pro 


Vd J. 


aia 


asn 


ara 


1 vs 


glu 


ser 


ser 


661/221 


















691/231 












ATG AAG 


ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 


AGG CTG 


TTG 


GCA 


GTA 


CTG 


ATC 


GCC 


CTC 


GCG 


met lys 


thr 


gly 


thr 


ala 


thr 


thr 


arg 


arg 


arg leu 


leu 


ala 


val 


leu 


ile 


ala 


leu 


ala 


721/241 


















751/251 


















TTG CCG 


GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 


GAA CCA 


TCA 


GCG 


ACC 


GGC 


GCG 


TCG 


GAC 


CCG 


leu pro 


gly 


ala 


ala 


val 


ala 


leu 


leu 


ala 


glu pro 


ser 


ala 


thr 


gly 


ala 


ser 


asp 


pro 


781/261 


















811/271 












TGC GCG 


GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


GTC 


GGT TCG 


GTC 


GCC 


AAG 


TCG 


ATG 


GGC 


GAC 


TAC 


cys ala 


ala 


ser 


glu 


val 


ala 


arg 


thr 


val 


gly ser 


val 


ala 


lys 


ser 


met 


gly 


asp 


tyr 


841/281 


















871/291 












CTG GAT 


TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


ATG ACC 


GCG 


GTC 


TTG 


CAG 


CAG 


CAG 


GTA 


GGG 


leu asp 


ser 


his 


pro 


glu 


thr 


asn 


gin 


val 


met thr 


ala 


val 


leu 


gin 


gin 


gin 


val 


gly 


901/301 


















931/311 














CCG GGG 


TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC GAG 


GCG 


AAT 


CCC 


AAG 


GTC 


GCA 


TCG 


GAT C 


pro gly 


ser 


val 


ala 


ser 


leu 


lys 


ala 


his 


phe glu 


ala 


asn 


pro 


lys 


val 


ala 


ser 


asp 



SEQ ID N° 1A 1 
FIGURE 1A 1 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



3/185 



Insert du clone 
2/1 

ATC GCC TTT GAC 
ile ala phe asp 
62/21 

GCG GGC GTC CAG 
ala gly val gin 
122/41 

GGG GTT GGG TGC 
gly val gly cys 
162/61 

GGC ATT GTC GAT 
gly ile val asp 
242/81 

CGG GGC TCC CCG 
arg gly ser pro 
302/101 

CCC GGC GAC TTC 
pro gly asp phe 
362/121 

CGC CGG CAC TAA 
arg arg his OCH 
422/141 

GCG GCT CAA CCG 
ala ala gin pro 
482/161 

TGC CCG CGA GCC 
cys pro arg ala 
542/181 

AGT TGG CGG CGC 
ser trp arg arg 
602/201 

AGG CCG CCG GAC 
arg pro pro asn 
662/221 

TGA AGA CAG GCA 
OPA arg gin ala 
722/241 

TGC CGG GGG CCG 
cys arg gly pro 
782/261 

GCG CGG CCA GCG 
ala arg pro ala 
842/281 

TGG ATT CAC ACC 
trp ile his thr 
902/301 

CGG GGT CGG TCG 
arg gly arg ser 



contenant DP428 

GCC TAT TCG GTC 
ala tyr ser val 

CCG CAG CGA CAC 
pro gin arg his 

CTC CGT CAC CCC 
leu arg his pro 

GTC TTG GTA GCT 
val leu val ala 

GTC CGG GTA GTG 
val arg val val 

GAA ACC GCC ACC 
glu thr ala thr 

CGC CAG CAA CCA 
arg gin gin pro 

CAT CAT GAA CTG 
his his glu leu 

TAC CGA AGA TCG 
tyr arg arg ser 

CGA GGG CCG AGA 
arg gly pro arg 

CGT CGC AAA CCC 
arg arg lys pro 

CCG CGA CGA CGC 
pro arg arg arg 

CCG TTG CGC TGC 
pro leu arg cys 

AAG TGG CGA GGA 
lys trp arg gly 

CAG AGA CCA ACC 
gin arg pro thr 

CAT CGC TGA AGG 
his arg OPA arg 



autre phase de 







32/11 


GCG 


CAG 


CTT TTT 


ala 


gin 


leu phe 






92/31 


CAC 


ATA 


CGG CCG 


his 


ile 


arg pro 






152/51 


AGG 


CAG 


TTC GCT 


arg 


gin 


phe ala 






212/71 


AGC 


ATC 


CGG TCG 


ser 


ile 


arg ser 






272/91 


CGC 


GTC 


GAG TTG 


arg 


val 


glu leu 






332/111 


GGT 


TAG 


ATT CCC 


gly 


AMB 


ile pro 






392/131 


ACC 


CGT 


GAA GAC 


thr 


arg 


glu asp 






452/151 


CTG 


GAT 


TTC GGA 


leu 


asp 


phe gly 






512/171 


CGT 


GCA 


TGC GTT 


arg 


ala 


cys val 






572/191 


TGG 


CAG 


GAT GAC 


trp 


gin 


asp asp 






632/211 


GTC 


GCA 


AAC CCG 


val 


ala 


asn pro 






692/231 


GGC 


GCA 


GGC TGT 


gly 


ala 


gly cys 






752/251 


TGG 


CCG 


AAC CAT 


trp 


pro 


asn his 






812/271 


CGG 


TCG 


GTT CGG 


arg 


ser 


val arg 






872/291 


AGG 


TGA 


TGA CCG 


arg 


OPA 


OPA pro 






932/311 


CCC 


ATT 


TCG AGG 


pro 


ile 


ser arg 



lecture 

GGC GAC GTC ACT 
gly asp val thr 

GTC CGG TTG CGG 
val arg leu arg 

GGC TAT TTG TCG 
gly tyr leu ser 

GGG GGC CGC TAC 
gly gly arg tyr 

GTC GTG GAC CAG 
val val asp gin 

CGA CTG CGT CAT 
arg leu arg his 

CAA CCA ACG GCA 
gin pro thr ala 

CTC CCC GTA CTC 
leu pro val leu 

CGG CGT GGA CCG 
arg arg gly pro 

GGA TCG TCG GGG 
gly ser ser gly 

TCG CAA ACC GTA 
ser gin thr val 

TGG CAG TAC TGA 
trp gin tyr OPA 

CAG CGA CCG GCG 
gin arg pro ala 

TCG CCA AGT CGA 
ser pro ser arg 

CGG TCT TGC AGC 
arg ser cys ser 

CGA ATC CCA AGG 
arg ile pro arg 



GGT GCC CGC GTT 
gly ala arg val 

GGG CCG TTG GGT 
gly pro leu gly 

CAG TAG CGC GAC 
gin AMB arg asp 

CAG CGC CAG CGC 
gin arg gin arg 

CAA TGA CTG CGA 
gin OPA leu arg 

CGC CAG GTA AAC 
arg gin val asn 

CCT GCG CAG GTT 
pro ala gin val 

TCG CGC AGT GCG 
ser arg ser ala 

CAC AGC ACC TGG 
his ser thr trp 

GCG GGA ACT CCC 
ala gly thr pro 

AGG AGT CAT CCA 
arg ser his pro 

TCG CCC TCG CGT 
ser pro ser arg 

CGT CGG ACC CGT 
arg arg thr arg 

TGG GCG ACT ACC 
trp ala thr thr 

AGC AGG TAG GGC 
ser arg AMB gly 

TCG CAT CGG ATC 
ser his arg ile 



SEQ ID N° IB' 
FIGURE IB' 



FEUILLE DE RE MP LACE ME NT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



4/185 



SeqlC: Insert du clone DP42 
3/1 

TCG CCT TTG ACG CCT ATT CGG 
ser pro leu thr pro ile arg 
63/21 

CGG GCG TCC AGC CGC AGC GAC 
arg ala ser ser arg ser asp 
123/41 

GGG TTG GGT GCC TCC GTC ACC 
gly leu gly ala ser val thr 
183/61 

GCA TTG TCG ATG TCT TGG TAG 
ala leu ser met ser trp AMB 
243/81 

GGG GCT CCC CGG TCC GGG TAG 
gly ala pro arg ser gly AMB 
303/101 

CCG GCG ACT TCG AAA CCG CCA 
pro ala thr ser lys pro pro 
363/121 

GCC GGC ACT AAC GCC AGC AAC 
ala gly thr asn ala ser asn 
423/141 

CGG CTC AAC CGC ATC ATG AAC 
arg leu asn arg ile met asn 
483/161 

GCC CGC GAG CCT ACC GAA GAT 
ala arg glu pro thr glu asp 
543/181 

GTT GGC GGC GCC GAG GGC CGA 
val gly gly ala glu gly arg 
603/201 

GGC CGC CGG ACC GTC GCA AAC 
gly arg arg thr val ala asn 
663/221 

GAA GAC AGG CAC CGC GAC GAC 
glu asp arg his arg asp asp 
723/241 

GCC GGG GGC CGC CGT TGC GCT 
ala gly gly arg arg cys ala 
783/261 

CGC GGC CAG CGA AGT GGC GAG 
arg gly gin arg ser gly glu 
843/281 

GGA TTC ACA CCC AGA GAC CAA 
gly phe thr pro arg asp gin 
903/301 

GGG GTC GGT CGC ATC GCT GAA 
gly val gly arg lie ala glu 



i, autre phase de lecture 
33/11 

TCG CGC AGC TTT TTG GCG 
ser arg ser phe leu ala 
93/31 

ACC ACA TAC GGC CGG TCC 
thr thr tyr gly arg ser 
153/51 

CCA GGC AGT TCG CTG GCT 
pro gly ser ser leu ala 
213/71 

CTA GCA TCC GGT CGG GGG 
leu ala ser gly arg gly 
273/91 

TGC GCG TCG AGT TGG TCG 
cys ala ser ser trp ser 

333/111 
CCG GTT AGA TTC CC : GAC 
pro val arg phe pro asp 

393/131 
CAA CCC GTG AAG ACC AAC 
gin pro val lys thr asn 

453/151 
TGC TGG ATT TCG GAC TCC 
cys trp ile ser asp ser 

513/171 
CGC GTG CAT GCG TTC GGC 
arg val his ala one gly 

. 573/191 
GAT GGC AGG ATG ACG GAT 
asp gly arg met thr asp 

633/211 
CCG TCG CAA ACC CGT CGC 
pro ser gin thr arg arg 

693/231 
GCG GCG CAG GCT GTT GGC 
ala ala gin ala val gly 

753/251 
GCT GGC CGA ACC ATC AGC 
ala gly arg thr ile ser 

813/27 1 
GAC GGT CGG TTC GGT CGC 
asp gly arg phe gly arg 

373/29*1 
CCA GGT GAT GAC CGC GGT 
pro gly asp asp arg gly 

93*3/311 
GGC CCA TTT CGA GGC GAA 
gly pro phe arg gly qlu 



ACG TCA CTG GTG CCC GCG TTG 

thr ser leu val pro ala leu 

GGT TGC GGG GGC CGT TGG GTG 

gly cys gly gly arg trp val 

ATT TGT CGC AGT AGC GCG ACG 

ile cys arg ser ser ala thr 

GCC GCT ACC AGC GCC AGC GCC 

ala ala thr ser ala ser ala 

TGG ACC AGC AAT GAC TGC GAC 

trp thr ser asn asp cys asp 

TGC GTC ATC GCC AGG TAA ACC 

cys val ile ala arg OCH thr 

CAA CGG CAC CTG CGC AGG TTG 

gin arg his leu arg arg leu 

CCG TAC TCT CGC GCA GTG CGT 

pro tyr ser arg ala val arg 

GTG GAC CGC ACA GCA CCT GGA 

val asp arg thr ala pro gly 

CGT CGG GGG CGG GAA CTC CCA 

arg arg gly arg glu leu pro 

AAA CCG TAA GGA GTC ATC CAT 

lys pro OCH gly val ile his 

AGT ACT GAT CGC CCT CGC GTT 

ser thr asp arg pro arg val 

GAC CGG CGC GTC GGA CCC GTG 

asp arg arg val giy pro val 

CAA GTC GAT GGG CGA CTA CCT 

gin val asp gly arg leu pro 

CTT GCA GCA GCA GGT AGG GCC 

leu ala ala ala gly arg aid 

TCC CAA GGT CGC ATC GGA TC 

ser gin gly arg ile gly 



SEQ ID N° 1C 
FIGURE 1C 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



5/185 



Sequence codante DP428 identique a la s 

(Nature 393:537-544) 

1/1 



ATG AAG 


ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 


Met lys 


thr 


gly 


thr 


ala 


thr 


thr 


arg 


arg 


61/21 














TTG CCG 


GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 


leu pro 


gly 


ala 


ala 


val 


ala 


leu 


leu 


ala 


121/41 


















TGC GCG 


GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


GTC 


cys ala 


ala 


ser 


glu 


val 


ala 


arg 


thr 


val 


181/61 
















CTG GAT 


TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


leu asp 


ser 


his 


pro 


glu 


thr 


asn 


gin 


val 


241/81 
















CCG GGG 


TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


pro gly 


ser 


val 


ala 


ser 


leu 


lys 


ala 


his 


301/101 


















CTG CAC 


GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


leu his 


ala 


leu 


ser 


gin 


pro 


leu 


thr 


asp 


361/121 
















GGC CTG 


CAG 


GCG 


ATC 


GGT 


TTG 


ATG 


CAG 


GCG 


gly leu 


gin 


ala 


ile 


gly 


leu 


met 


gin 


ala 



SEQ 



Eiquence Rv0203 predite par Cole et al. 



31/11 


















AGG CTG 


TTG 


GCA 


GTA 


CTG 


ATC 


GCC 


CTC 


GCG 


arg leu 
91/31 


leu 


ala 


val 


leu 


ile 


ala 


leu 


ala 


GAA CCA 


TCA 


GCG 


ACC 


GGC 


GCG 


TCG 


GAC 


CCG 


glu pro 
151/51 


ser 


ala 


thr 


gly 


ala 


ser 


asp 


Dro 


GGT TCG 


GTC 


GCC 


AAG 


TCG 


ATG 


GGC 


GAC 


TAT 


gly ser 
211/71 


val 


ala 


lys 


ser 


met 


cjl v 


asp 


t vr 


ATG ACC 


GCG 


GTC 


TTG 


CAG 


CAG 


CAG 


GTA 


GGG 


met thr 
271/91 


ala 


val 


leu 


gin 


gin 


gin 


val 


gly 


TTC GAG 


GCG 


AAT 


CCC 


AAG 


GTC 


GCA 


TCG 


GAT 


phe glu 
331/111 


ala 


asn 


pro 


lys 


val 


ala 


ser 


asp 


CTT TCG 


ACT 


CGG 


TGC 


TCG 


CTG 


CCG 


ATC 


AGC 


leu ser 
391/131 


thr 


arg 


cys 


ser 


leu 


pro 


lie 


ser 


GTG CAG 


GGC 


GCC 


CGC 


CGG 


TAG 








val gin 


gly 


ala 


arg 


arg 


AMB 









N° ID 



FIGURE ID 



ORF contenant la sequence DP428 et faisant partie de seqlA' 
1/1 ' 31/11 

TGA CGG ATC GTC GGG GGC GGG AAC TCC CAG GCC GCC GGA CCG TCG CAA ACC CGT CGC AAA 
OPA arg ile val gly gly gly asn ser gin ala ala gly oro ser gin thr an a-c lvs 
61/21 91/31 

CCC GTC GCA AAC CGT AAG GAG TCA TCC ATG AAG ACA GGC ACC GCG ACG ACG CGG CGC AGG 
pro val ala asn arg lys glu ser ser met lys thr glv thr ala thr thr arq arq arq 
121/41 151/51 

CTG TTG GCA GTA CTG ATC GCC CTC GCG TTG CCG GGG GCC GCC GTT GCG CTG CTG GCC GAA 
leu leu ala val leu ile ala leu ala leu pro gly ala ala val ala leu leu ala qlu 
181/61 211/71 

CCA TCA GCG ACC GGC GCG TCG GAC CCG TGC GCG GCC AGC GAA GTG GCG AGG ACG GTC GGT 
pro ser ala thr gly ala ser asp pro cys ala ala ser glu val ala arg thr val qi y 
241/81 271/91 

TCG GTC GCC AAG TCG ATG GGC GAC TAC CTG GAT TCA CAC CCA GAG ACC AAC CAG GTG ATG 
ser val ala lys ser met gly asp tyr leu asp ser his oro glu thr asn gin va^ met 
301/101 331/111 

ACC GCG GTC TTG CAG CAG CAG GTA GGG CCG GGG TCG GTC GCA TCG CTG A^G GCC CAT TTC 
thr ala val leu gin gin gin val gly oro glv ser val ala ser leu lys a ' a his o-- 
361/121 391/131 

GAG GCG AAT CCC AAG GTC GCA TCG GAT CTG CAC GCG CTT TCG CAA CCG CTG ACC GAT CTT 
glu ala asn pro lys val ala ser asp leu his ala Leu ser gin pro leu thr ^so leu 
421/141 451/151 " ' 

TCG ACT CGG TGC TCG CTG CCG ATC AGC GGC CTG CAG GCG ATC GGT TTG ATG CAG GCG GTG 
ser thr arg cys ser leu pro lie ser gly leu gin ala lie gly leu met gin ala val 
431/161 

CAG GGC GCC CGC CGG TAG 
gin gly ala arg arg AM 3 

SEQ ID N° IF 



FEUILLE DE REMF^Lj££©Se^T (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



6/185 



4 91 CCGGTCGGGGGGCCGCTACCAGCGCCAGCGCCGGGGCTCCCCGGTCCGGGTA GTG CGC GTC GAG TTG GTC GTG 563 
1 VRVELVV7 



554 GAC CAG CAA TGA CTGCGACCCGGC 3ACTTCGAAACCGCCA CCGGTT AGATTCCCCGACTGCGTCATCG 2CAGGTAA 639 
8 D Q Q 



64 0 ACCGCCGGCACTAACGCCAGCAACCAACCC GTG AAG ACC AAC CAA CGG CAC CTG CGC AGG TTG CGG 
1 VKTNQRHLRRLR 



705 
12 



7 06 CTC AAC CGC ATC ATG AAC TGC TGG ATT TCG GAC TCC CCG TAC 
13LNRIMNCWISDSPY 



TCT 
S 



CGC GCA GTG CGT GCC 
R A V R A 



765 
32 



756 
33 


CGC 
R 


GAG 

£ 


CCT 

? 


ACC 
T 


GAA 
E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC 
R 


ACA 
T 


GCA 
A 


CCT 
P 


GGA 
G 


GTT 

V 


825 
52 


826 
53 


GGC 
G 


GGC 
G 


GCC 
A 


GAG 


GGC 
G 


CGA 
R 


GAT 

D 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
D 


CGT 
R 


CGG 
R ' 


GGG 
G 


CGG 
R 


GAA 
E 


CTC 
L 


CCA 
P 


GGC 

G 


835 
72 


636 
7 3 


CGC 
R 


CGG 
R 


ACC 


GTC 

V 


GCA 
A 


AAC 

N 


CCG 
P 


TCG 
3 


CAA 
Q 


ACC 
T 


CGT 
R 


CGC 
R 


AAA 

K 


CCG 

P 


TAA GGAGTCATCC ATG AAG 
* xx :<xx/. M K 


946 
*> 


947 
3 


ACA 
T 


GGC 
G 


ACC 


GCG 
A 


ACG 
T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG 
r 


TTG 
L 


GCA 


GTA 
V 


CTG 
L 


ATC 

I 


GCC 
A 


CTC 
L 


GCG 
A 


TTG 
L 


CCG 
P 


1006 


037 
23 


GGG 
G 


GCC 
A 


GCC 
A 


GTT 
V 


i 

GC< 
A 




CTG 
L 


CTG 
L 


GCC 
A 


GAA 
E 


CCA 
P 


TCA 

S 


GCG 
A 


ACC 


GGC 
G 


GCG 
A 


TCG 
S 


GAC 
D 


CCG 
P 


TGC 
r 


GCG 
A 


1066 
42 


067 
43 


GCC 
A 


AGC 
S 


GAA 
r 


GTG 
V 


GCi 
A 


3 


AGG 
R 


ACG 
T 


GTC 
V 


GGT 
G 


TCG 
S 


GTC 
V 


GCC 
A 


AAG 
K 


TCG 
S 


ATG 
M 


GGC 
G 


GAC 
D 


TAC 
Y 


CTG 
L 


GAT 
D 


1126 
62 


127 
63 


TCA 
S 


CAC 
H 


CCA 
P 


GAG 
E 


ACC 
T 


AAC 
N 


CAG 
Q 


GTG 
V 


ATG 
M 


ACC 
T 


GCG 
A 


GTC 
V 


TTG 
L 


CAG 
Q 


CAG 
Q 


CAG 
Q 


GTA 
V 


GGG 
G 


CCG 
p 


GGG 
G 


1186 
82 


.197 
93 


TCG 
S 


GTC 
V 


GCA 
A 


TCG 
S 


CTG 
L 


AAG 

K 


GCC 
A 


CAT 
H 


TTC 
F 


GAG 
r 


GCG- AAT 
A N 


CCC 
p 


AAG 

K 


GTC 

V 


GCA 
A 


TCG 
S 


GAT 
D 


CTG 


CAC 

H 


1246 
102 


L247 


GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


CTT 


TCG 


ACT 


CGG 


TGC 


TCG 


CTG 


CCG 


ATC 


AGC 


GGC 


CTG 


13C6 


103 


A 


L 


S 


0 


p 




L 


T 


D 


L 


S 


T 


R 


C 


S 


■< 


P 




s 1 


G 1 


L 


122 


.307 
123 


CAG 
Q 


GCG 
A 


ATC 
I 


GGT 
G 


TTG 
L 


ATG 

M 


CAG 
Q 


GCG 
A 


GTG 
V 


CAG 
Q 


GGC 
G 


GCC 


CGC 
R 


CGG 

*l 


TAG 


AT 
M 


3 CCG GA 
? D 


Z CGC CGC 
R R 


1366 
5 


367 
5 


R 


GTC 
V 


CGG 
R 


CGC 
R 


AGT 
3 


CGA 
R 


CGT 
R 


GAG 


GCA 
A 


GCG 
A 


GTC 
V 


A 


TAC 
Y 


CGG 
R 


G 


i 

G 


V 


TCG 
S 


P 


CCT 
p 


25 


,427 
25 


TCT 
S 


GGT 


R 


A3G 
R 


TCA 
S 


GGG 
G 


GTC 
V 


GGC 
G 


GCT 
A 


GGA 
G 


P 




GGT 


V 


GTT 
V 


TCG 
S 


ACC 
T 


GGG 
G 


TCG 
S 


TCG 
S 


14 26 
45 


.487 
46 


CAG 
Q 


GGT 
G 


GTG 
V 


CCC 
p 


TGC 
C 


GGT 
G 


TGG 
W 


ATG 
M 


ACA 
T 


AGT 
S 


CGC 
R 


AGG 
R 


TTT 
F 


GGA 
G 


TCG 
3 


GTT 
V 


GljC 
G 


GGG 
G 


TCG 
3 


CGA 
R 


1546 
65 



1547 TCG TTG 



1553 



SEQ ID N° 2 



FIGURE 2 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



7/185 



31/11 



TCG CCG 


GCT 


CGC 


GGA 


CGT 


AGA 


TAA 


TAG 


CTC 


ACC GTT 


GGA 


CCA 


CCT 


CGA 


CAG 




CCT 


TTG 


ser pro 


ala 


arg 


gly 


arg 


arg 


OCH 


AMB 


leu 


thr val 


ol v 


arg 


pro 


arg gin 


gly 


p ro 


1 eu 


61/21 


















91/31 














TGA CTG 


CCG 


GGC 


TTG 


ACG 


CGG 


ACG 


ACC 


ACA 


GAG TCG 


GGT 


CAT 




CTA 


AGG 


CTA 


CCG 


TTC 


OPA leu 


pro 


gly 


leu 


thr 


arg 


thr 


thr 


thr 


glu ser 


gly 


his 


arg 


leu 


arg 


leu 


pro 


phe 


121/41 


















151/51 










TGA CCT 


GGG 


GTG 


CGT 


GGG 


CGC 


CGA 


CGA 


GTG 


AGG CAG 


1 






AGG 


GCC 


CAC 


CGC 


CAC 


OPA pro 


gly 


val 


arg 


gly 


arg 


arg 


arg 


val 


arg gin 


ser 


cys 


leu 


arg 


ala 


his 


arg 


his 


181/61 


















211/71 










CTC GGT 


CGC 


CGG 


CAG 


TGT 


CAG 


CAT 


GTG 


CAG 


ATG ACT 


CCA 


CGC 


AGC 


TTG 


TTC 


GTG 


TTG 


GTG 


leu qly 


arq 


arq 


qln 


cys 


gin 


his 


val 


gin 


met thr 


pro 


arg 


ser 


leu 


phe 


val 


leu 


val 


241/81 


















271/91 














TCG TGG 


TTG 


CGA 


CGA 


CTT 


GGC 


GCT 


GGT 


GAG 


CGC ACC 


CGC 


CGG 


CGT 


CGT 


GCC 


GCG 


CAT 


GCG 


ser trp 


leu 


arg 


arg 


leu 


gly 


ala 


gly 


glu 


arg thr 


arg 


arg 


arg 


arg 


ala 


ala 


his 


ala 




























GAT C 




































asp 


















































SEQ ID N° 3A 
































FIGURE 3A 




































32/11 


















CGC CGG 


CTC 


GCG 


GAC 


GTA 


GAT 


AAT 


AGC 


TCA 


CCG TTG 


GAC 


GAC 


CTC 


GAC 


AGG 


CTC 


v.1 i 


1 \J 1 


arg arg 


leu 


ala 


asp 


val 


asp 


asn 


ser 


ser 


pro leu 


asp 


asp 


leu 


asp 


arg 


val 


leu 


cys 


62/21 


















92/31 














GAC TGC 


CGG 


GCT 


TGA 


CGC 


GGA 


CGA 


CCA 


CAG 


AGT CGG 


GTC 


ATC 


GCC 


TAA 


GGC 


TAC 


CGT 


TCT 


asp cys 


arg 


ala 


OPA 


a rg 


gly 


arg 


pro 


gin 


ser arg 


val 


ile 


ala 


OCH 


gly 


ty r 


arg 


ser 


122/41 


















152/51 












GAC CTG 


GGG 


TGC 


GTG 


GGC 


GCC 


GAC 


GAG 


TGA 


GGC AGT 


CAT 


GTC 


TCA 


GGG 


CCC 


ACC 


mr 


ACC 


asp leu 


gly 


cys 


val 


gly 


ala 


asp 


glu 


OPA 


gly ser 


his 


val 


ser 


gly 


pro 


thr 


ala 


thr 


182/61 


















212/71 
















TCG GTC 


GCC 


GGC 


AGT 


GTC 


AGC 


ATG 


TGC 


AGA 


TGA CTC 


CAC 


GCA 


GCT 


TGT 


TCG 


TGT 


TGG 


TGT 


ser val 


ala 


gly 


ser 


val 


ser 


met 


cys 


arg 


OPA leu 


his 


ala 


ala 


cys 


ser 


cys 


trp 


cys 


242/81 


















272/91 












CGT GGT 


TGC 


GAC 


GAC 


TTG 


GCG 


CTG 


GTG 


AGC 


GCA CCC 


GCC 


GGC 


GTC 


GTG 


CCG 


CGC 


ATG 


CGG 


arg gly 


cys 


asp 


asp 


leu 


ala 


leu 


val 


ser 


ala pro 


ala 


gly 


val 


val 


pro 


arg 


met 


arg 


302/101 































ATC 
ile 



SEQ ID N° 3B 
FIGURE 3B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



8/185 



GCC GGC TCG CGG ACG TAG ATA ATA GCT 
ala gly ser arg thr AMB ile ile ala 
63/21 

ACT GCC GGG CTT GAC GCG GAC GAC CAC 
thr ala gly leu asp ala asp asp his 
123/41 

ACC TGG GGT GCG TGG GCG CCG ACG AGT 
thr trp gly ala trp ala pro thr ser 
183/61 

CGG TCG CCG GCA GTG TCA GCA TGT GCA 
arg ser pro ala val ser ala cys ala 
243/81 

GTG GTT GCG ACG ACT TGG CGC TGG TGA 
val val ala thr thr trp arg trp OPA 

TC 



33/11 



CAC 


CGT TGG 


ACG 


ACC 


TCG 


ACA 


GGG 


TCC 


TTT 


GTG 


his 


arg trp 
93/31 


thr 


thr 


ser 


thr 


gly 


ser 


phe 


val 


AGA 


GTC GGG 


TCA 


TCG 


CCT 


AAG 


GCT 


ACC 


GTT 


CTG 


arg 


val gly 
153/51 


ser 


ser 


pro 


lys 


ala 


thr 


val 


leu 


GAG 


GCA GTC 


ATG 


TCT 


CAG 


GGC 


CCA 


CCG 


CCA 


CCT 


glu 


ala val 
213/71 


met 


ser 


gin 


gly 


pro 


pro 


pro 


pro 


GAT 


GAC TCC 


ACG 


CAG 


CTT 


GTT 


CGT 


GTT 


GGT 


GTC 


asp 


asp ser 
273/91 


thr 


gin 


leu 


val 


arg 


val 


gly 


val 


GCG 


CAC CCG 


CCG 


GCG 


TCG 


TGC 


CGC 


GCA 


TGC 


GGA 


ala 


his pro 


pro 


ala 


ser 


cys 


arg 


ala 


cys 


gly 



SEQ ID N° 3C 
FIGURE 3C 



CCA ATT TTC CTT CGC GCC GTG CAA TAC CAT 

pro ile phe leu arg ala val gin tyr his 
61/21 

GTC GCG CAG CTT GCG GAA ACC GGG TAT GGA 

val ala gin leu ala glu thr gly tyr gly 
121/41 

CGT CGC TCT CCA CCC GTC GGG GGG CGA AAG 

arg arg ser pro pro val gly gly arg lys 
181/61 

GGC TGA GTG TCT GCA GGG CTC CGG GGA GCA 

gly OPA val ser ala gly leu arg gly ala 
241/81 

GTC CCC CGC GCG CGA CTT CCA GAC ATT TGT 

val pro arg ala arg leu pro asp ile cys 
301/101 

CAT TTC GCA GCA ACC GGT CTC CGG GTC GCA 

his phe ala ala thr gly leu arg val ala 
361/121 

CGG ACG AGT CGT CGT CAA CGA CCA CGA TC 

arg thr ser arg arg gin arg pro arg 



31/11 

CTG CAA GAC CAG CGA CGG CCC GTG GTT GCG 

leu gin asp gin arg arg pro val val ala 
91/31 

CCC TGC CGT ACC GTT GTT GCC ACT TGA TGT 

pro cys arg thr val val ala thr OPA cys 
151/51 

CCA TTC CGA CAC TGG GAT CCT CAA AAC GTC 

pro phe arg his trp asp pro gin asn val 
211/71 

GCC GAT CAT CAC CAT GTA CGA ACT GAA TAA 

ala asp his his his val arg thr glu OCH 
271/91 

TGT GGT TTC GGT TGA GGC CGA GGC GAG GCT 

cys gly pne giy OPA gly arg gly glu ala 
331/111 

GCA TCG TTG CGG CGA TCG CGG CGC AGT CGT 

ala ser leu arg arg ser arg arg ser arg 



SEQ ID N° 4A 
FIGURE 4A 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



9/185 



CAA TTT TCC TTC 
gin phe ser phe 
62/21 

TCG CGC AGC TTG 
ser arg ser leu 
122/41 

GTC GCT CTC CAC 
val ala leu his 
182/61 

GCT GAG TGT CTG 
ala glu cys leu 
242/81 

TCC CCC GCG CGC 
ser pro ala arg 
302/101 

ATT TCG CAG CAA 
ile ser gin gin 
362/121 

GGA CGA GTC GTC 
gly arg val val 



GCG CCG TGC AAT 
ala pro cys asn 

CGG AAA CCG GGT 
arg lys pro gly 

CCG TCG GGG GGC 
pro ser gly gly 

CAG GGC TCC GGG 
gin gly ser gly 

GAC TTC CAG ACA 
asp phe gin thr 

CCG GTC TCC GGG 
pro val ser gly 

GTC AAC GAC CAC 
val asn asp his 







7 9/11 








Lnr 


-i "1 o 

ne 


cys lys 








/A 1 o 


far* 




met 


asp 


pro ala 






152/51 


GAA 


AGC 


CAT TCC 


glu 


ser 


his ser 






212/71 


GAG 


CAG 


CCG ATC 


glu 


gin 


pro ile 






272/91 


TTT 


GTT 


GTG GTT 


phe 


val 


val val 






332/111 


TCG 


CAG 


CAT CGT 


ser 


gin 


his arg 


GAT 


C 





asp 



SEQ ID N° 4B 
FIGURE 4B 



ACC AGC GAC GGC 
thr ser asp gly 

GTA CCG TTG TTG 
val pro leu leu 

GAC ACT GGG ATC 
asp thr gly ile 

ATC ACC ATG TAC 
ile thr met tyr 

TCG GTT GAG GCC 
ser val glu ala 

TGC GGC GAT CGC 
cys gly asp arg 



CCG TGG TTG CGG 
pro trp leu arg 

CCA CTT GAT GTC 
pro leu asp val 

CTC AAA ACG TCG 
leu lys thr ser 

GAA CTG AAT AAG 
glu leu asn lys 

GAG GCG AGG CTC 
glu ala arg leu 

GGC GCA GTC GTC 
gly ala val val 



AAT TTT CCT TCG CGC CGT GCA ATA CCA 

asn phe pro ser arg arg ala ile pro 
63/21 

CGC GCA GCT TGC GGA AAC CGG GTA TGG 

arg ala ala cys gly asn arg val trp 
123/41 

TCG CTC TCC ACC CGT CGG GGG GCG AAA 

ser leu ser thr arg arg gly ala lys 
183/61 

CTG AGT GTC TGC AGG GCT CCG GGG AGC 

leu ser val cys arg ala pro gly ser 
243/81 

CCC CCG CGC GCG ACT TCC AGA CAT TTG 

pro pro arg ala thr ser arg his leu 
303/101 

TTT CGC AGC AAC CGG TCT CCG GGT CGC 

phe arg ser asn arg ser pro gly arg 
363/121 

GAC GAG TCG TCG TCA ACG ACC ACG ATC 

asp glu ser ser ser thr thr thr ile 



33/11 

TCT GCA AGA CCA GCG ACG GCC CGT GGT TGC GGT 
ser ala arg pro ala thr ala arg gly cys gly 
93/31 

ACC CTG CCG TAC CGT TGT TGC CAC TTG ATG TCG 
thr leu pro tyr arg cys cys his leu met ser 
153/51 

GCC ATT CCG ACA CTG GGA TCC TCA AAA CGT CGG 
ala ile pro thr leu gly ser ser lys arg arg 
213/71 

AGC CGA TCA TCA CCA TGT ACG AAC TGA ATA AGT 
ser arg ser ser pro cys thr asn OPA ile ser 
273/91 

TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA 
leu trp phe arg leu arg pro arg arg giv se- 
333/111 

AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG 
ser lie val ala ala lie ala ala gin ser ser 



SEQ ID N° 4C 
FEUILLE DE REMPtfcfcififertf (REGLE 26) 



WO 99/09186 



PCT/FR98/018I3 



10/185 



partie de la sequence nucleotidique de seq4A 

31/11 

CCG CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA TTT 
pro arg ala thr ser arg his leu leu trp phe arg leu arg pro arg arg gly ser phe 
61/21 91/31 

CGC AGC AAG CGG TCT CCG GGT CGC AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG GAC 
arg ser lys arg ser pro gly arg ser ile val ala ala ile ala ala gin ser ser asp 

121/41 ^ 
GAG TCG TCG TCA ACG ACC ACG ATC 
glu ser ser ser thr thr thr ile 



SEQ ID N° 4A' 
FIGURE 4A f 



1/1 

CGC GCG CGA CTT CCA GAC ATT 
arg ala arg leu pro asp ile 
61/21 

GCA GCA AGC GGT CTC CGG GTC 
ala ala ser gly leu arg val 
121/41 

AGT CGT CGT CAA CGA CCA CGA 
ser arg arg gin arg pro arg 



31/11 

TGT TGT GGT TTC GGT TGA 
cys cys gly phe gly OPA 
91/31 

GCA GCA TCG TTG CGG CGA 
ala ala ser leu arg arg 

TC 



SEQ ID N° 4 B T 
FIGURE 4B» 



GGC CGA GGC GAG GCT CAT TTC 
gly arg gly glu ala his phe 

TCG CGG CGC AGT CGT CGG ACG 
ser arg arg ser arg arg thr 



1/1 

GCC GCG CGC GAC TTC CAG ACA TTT GTT GTG 

ala ala arg asp phe gin thr phe val val 
61/21 

TCG CAG CAA GCG GTC TCC GGG TCG CAG CAT 

ser gin gin ala val ser gly ser gin his 
121/41 

CGA GTC GTC GTC AAC GAC CAC GAT C 

arg val val val asn asp his asp 



31/11 

GTT TCG GTT GAG GCC GAG GCG AGG CTC ATT 
val ser val glu ala glu ala arg leu ile 
91/31 

CGT TGC GGC GAT CGC GGC GCA GTC GTC GGA 
arg cys gly asp arg gly ala val val gly 



SEQ ID N° 4C 
FIGURE 4C* 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



ORF d'apres par Cole et al 

4A* 

1/1 



tga ata 


agt 


ccg 


ccg 


cgc 


gcg 


OPA ile 


ser 


pro 


pro 


arg 


ala 


61/21 












cga ggc 


tea 


ttt 


cgc 


age 


aag 


arg gly 


ser 


phe 


arg 


ser 


lys 


121/41 










cag teg 


teg 


gac 


gag 


teg 


teg 


gin ser 


ser 


asp 


glu 


ser 


ser 


181/61 












agg atg 


eta 


cgc 


aga 


cag 


cgc 


arg met 


leu 


arg 


arg 


gin 


arg 


241/81 












gag ata 


age 


ggt 


ttc 


gee 


ggg 


glu ile 


ser 


gly 


phe 


ala 


gly 


301/101 










tgg cga 


etc 


aga 


gac 


tag 




trp arg 


leu 


arg 


asp 


AMB 





11/185 

. (Nature 393:537-544} 
31/11 

act tec aga cat ttg ttg 
thr ser arg his leu leu 
91/31 

egg tct ccg ggt cgc age 
arg ser pro gly arg ser 
151/51 

tea acg acc acg ate teg 
ser thr thr thr ile ser 
211/71 

teg atg gtg gcg ccg ttg 
ser met vai ala pro leu 
271/91 

ttc acc gat acc acg ctt 
phe thr asp thr thr leu 



et contenant la sequence Seq 

tgg ttt egg ttg agg ccg agg 
trp phe arg leu arg pro arg 

ate gtt gcg gcg ate gcg gcg 
ile val ala ala ile ala ala 

aac teg acg ccc tec tgt teg 
asn ser thr pro ser cys ser 

ttg tac ate ggg atg cac acc 
leu tyr ile gly met his thr 

gat gca tea cca ggc acc aca 
asp ala ser pro gly thr thr 



SEQ ID N° 4F 



FIGURE 4F 



sequence en amont de seq4A' et en fusion avec seq4A ! 
1/1 31/11 

GCA ACC TAC CAG CAG AGC CAG GGG CTC ACA GGA CCT AAA GGA GTA GCG CCC ATG GCT GAT 
ala thr tyr gin gin ser gin gly leu thr gly pro lys gly val ala pro met ala asp 



SEQ ID N° 4J 



FIGURE 4J 



seq4J' dans une autre phase de lecture 
1/1 

ACG CAA CCT ACC AGC AGA GCC AGG GGC TCA 

thr gin pro thr ser arg ala arg giy ser 

61/21 

ATC 

ile 



31/11 

CAG GAC CTA AAG GAG TAG CGC CCA TGG CTG 
gin asp leu lys glu AMB arg pro trp leu 



SEQ ID N°4K 



FIGURE 4K 



seq 4J' dans la troisiene phase de lecture 
1/1 31/11 

CGC AAC CTA CCA GCA GAG CCA GGG GCT CAC AGG ACC TAA AGG AGT AGC GCC CAT GGC TGA 

arg asn leu pro ala glu pro gly ala his arg thr CC?i arg ser ser ala his glv OPA 

TC 

SEQ ID N° 4L 



FEUILLE DE REMPLA?^rtk^f(REGLE 26) 



WO 99/09186 



PCIYFR98/01813 



12/185 



sequence Rv2050 


predite 


1/1 










ATG GCT 


GAT 


CGT 


GTC 


CTG 


Met ala 


asp 


arg 


val 


leu 


61/21 










AAC CAC 


GAC 


CTG 


GCG 


CCG 


asn his 


asp 


leu 


ala 


pro 


121/41 










GAA GTC 


CCG 


TTC 


GCC 


GAT 


glu val 


pro 


phe 


ala 


asp 


181/61 










GAA GGC 


ACC 


CTG 


ATC 


GAG 


glu gly 


thr 


leu 


ile 


glu 


241/81 










CAC TGG 


GAC 


ATG 


CTG 


CTG 


his trp 


asp 


met 


leu 


leu 


301/101 










CGC CTC 


GAG 


CTC 


ATT 


CGG 


arg leu 


glu 


leu 


ile 


arg 



par 


Cole et 


al. 


(Nature 


393 










31/11 




AGG 


GGC 


AGT 


CGC 


CTC GGA 


GCC 


arg 


gly 


ser 


arg 


leu gly 


ala 










91/31 




CGC 


CAG 


ATC 


GCG 


CGG TAC 


CGC 


arg 


gin 


ile 


ala 


arg tyr 


a r a 










151/51 




GAC 


GCC 


GAG 


ATC 


CCC GGC 


ACC 


asp 


ala 


glu 


ile 


pro gly 


thr 










211/71 




GGC 


GAC 


CTG 


CCC 


GAG CCG 


J\AG 


gly 


asp 


leu 


pro 


glu pro 


lys 










271/91 




GAG 


CGC 


CGT 


TCC 


ATC GAA 


GAA 


glu 


arg 


arg 


ser 


ile glu 


glu 










331/111 




TCA 


CGT 


CGG 


CGC 


GGC TGA 




ser 


arg 


arg 


arg 


gly OPA 





SEQ ID N° 4M 
FIGURE 4M 



: 537-544) et contenant seq4J 



GTG 


AGC 


TAT 


GAG 


ACC 






val 


ser 


tyr 


glu 


thr 


asp 


arg 


ACC 


GAC 


AAC 


GGC 


GAG 


GAG 


TTC 


thr 


asp 


asn 


gly 


glu 


glu 


phe 


TGG 


TTG 


TGC 


CGC 


AAC 


GGC 


ATG 


trp 


leu 


cys 


arg 


asn 


gly 


met 


AAG 


GTT 


AAG 


CCG 


CCC 


CGG 


ACG 


lys 


val 


lys 


pro 


pro 


arg 


thr 


CTC 


GAA 


GAG 


TTA 


CTT 


AAG 


GAG 


leu 


glu 


glu 


leu 


leu 


lys 


glu 



ORF d'apres par Cole et al. (Nature 393 
1/1 

TAG TCC GCC CGG GTG TCC GAT CCC GGT ATC 
AMB ser ala arg val ser asp pro gly ile 
61/21 

CGG GAA CTA CGC AGA CGG CCG CAG CGT TTG 
arg glu leu arg arg arg pro gin arg leu 
121/41 

TAC CAG CAG AGC CCA GGG CTC ACA GGA CCT 
tyr gin gin ser pro gly leu thr gly pro 
181/61 

CTG AGG GGC AGT CGC CTC GGA GCC GTG AGC 
leu arg gly ser arg leu gly ala val ser 
241/81 

CCG CGC CAG ATC GCG CGG TAC CGC ACC GAC 
pro arg gin ile ala arg tyr arg thr asp 
301/101 

GAT GAC GCC GAG ATC CCC GGC ACC TGG TTG 
asp asp ala glu ile pro gly thr tro leu 
361/121 

GAG GGC GAC CTG CCC GAG CCG AAG AAG GTT 
glu gly asp leu pro glu pro lys Ivs val 
421/141 

CTG GAG CGC CGT TCC ATC GAA GAA CTC GAA. 
leu glu arg arg ser lie glu glu leu glu 
481/161 

CGG TCA CGT CGC CGC GGC TGA 
arg ser arg ar; arg gly OPA 



537-544) et contenant la sequence Rv2050 
31/11 

ATT GAT GGT CGC GCC GCG CGC GTC GCG TGC 

ile asp gly arg ala ala arg val ala cvs 
91/31 

CCA ACC GGA GCC AGT CGC CAG TAC GCA ACC 

pro thr gly ala ser arg gin tvr ala thr 
151/51 

AAA GGA GTA GCG CCC ATG GCT GAT CGT GTC 

lys gly val ala pro met ala asp arg val 
211/71 

TAT GAG ACC GAC CGC AAC CAC GAC CTG GCG 

tyr glu thr asp arg asn his aso leu ala 
271/91 

AAC GGC GAG GAG TTC GAA GTC CCG TTC GCC 

asn gly glu glu phe glu val pro phe ala 
331/111 

TGC CGC AAC GGC ATG GAA GGC AC Z CTG ATC 

cys arg asn gly met glu gly thr leu ile 
391/131 

AAG CCG CCC CGG ACG CAC TGG GAC ATG CTC 

lys pro oro arg thr his tro aso met leu 
451/151 

GAG TTA CTT AAG GAG CGC CTC GAC CTC AT I 1 

glu leu leu lys glu arg leu glu leu lie 



SEQ ID N° 4N 



FEU1LLE DE REMPk^ggMgNT (REGLE 26) 



WO 99/09186 



PCT/FR98/0I813 



13/185 



GAT CGC 


GGT 


CAA 


CGA 


GGC 


asp arg 


gly 


gin 


arg 


gly 


61/21 










TGG CTA 


CGC 


CGC 


GGC 


GAC 


trp leu 


arg 


arg 


gly 


asp 


121/41 










GGA GAT 


GAC 


CAG 


CGC 


GGG 


gly asp 


asp 


gin 


arg 


gly 


181/61 










CAC CGC 


CGC 


GGC 


GAA 


CCA 


his arg 


arg 


gly 


glu 


pro 


241/81 










GCC CAC 


GCA 


GGG 


CAC 


CAC 


ala his 


ala 


gly 


his 


his 


301/101 










GCA TCG 


GTC 


GCC 


GAT 


C 


ala ser 


val 


ala 


asp 





31/11 

CGA ATA CGG CGA GAT GTG GGC 
arg ile arg arg asp val gly 
91/31 

GGC GAC GGC GAC GGC GAC GTT 
gly asp gly asp gly asp val 
151/51 

TGG GCT CCT CGA GCA GGC CGC 
trp ala pro arg ala gly arg 
211/71 

GTT GAT GAA CAA TGT GCC CCA 
val asp glu gin cys ala pro 
271/91 

GCC TTC TTC CAA GCT GGG TGG 
ala phe phe gin ala gly trp 



CCA AGA CGC CGC CGC GAT GTT 
pro arg arg arg arg asp val 

GCT GCC GTT CGA GGA GGC GCC 
ala ala val arg gly gly ala 

CGC GGT CGA GGA GGC CTC CGA 
arg gly arg gly gly leu arg 

GGC GCT GCA ACA GCT GGC CCA 
gly ala ala thr ala gly pro 

CCT GTG GAA GAC GGT CTC GCC 
pro val glu asp gly leu ala 



SEQ ID N° 5A 
FIGURE 5A 



ATC GCG GTC AAC GAG GCC 
ile ala val asn glu ala 
62/21 

GGC TAC GCC GCG GCG ACG 
gly tyr ala ala ala thr 
122/41 

GAG ATG ACC AGC GCG GGT 
glu met thr ser ala gly 
182/61 

ACC GCC GCG GCG AAC CAG 
thr ala ala ala asn gin 
242/81 

CCC ACG CAG GGC ACC ACG 
pro thr gin gly thr thr 
302/101 

CAT CGG TCG CCG ATC 
his arg ser pro ile 











32/11 




GAA 


TAC 


GGC 


GAG 


ATG TGG 


GCC 


glu 


tyr 


gly 


glu 


met trp 


ala 










92/31 




GCG 


ACG 


GCG 


ACG 


GCG ACG 


TTG 


ala 


thr 


ala 


thr 


ala thr 


leu 










152/51 




GGG 


CTC 


CTC 


GAG 


CAG GCC 


GCC 


gly 


leu 


leu 


glu 


gin ala 


ala 










212/71 




TTG 


ATG 


AAC 


AAT 


GTG CCC 


CAG 


leu 


met 


asn 


asn 


val pro 


gin 










272/91 




CCT 


TCT 


TCC 


AAG 


CTG GGT 


GGC 


pro 


ser 


ser 


lys 


leu gly 


gly 



SEQ ID N° 5B 
FIGURE 5B 



CAA 


GAC 


GCC 


GCC 


GCG 


ATG 


TTT 


gin 


asp 


ala 


ala 


ala 


met 


phe 


CTG 


CCG 


TTC 


GAG 


GAG 


GCG 


CCG 


leu 


pro 


phe 


glu 


glu 


ala 


pro 


GCG 


GTC 


GAG 


GAG 


GCC 


TCC 


GAC 


ala 


val 


glu 


glu 


ala 


ser 


asp 


GCG 


CTG 


CAA 


CAG 


CTG 


GCC 


CAG 


ala 


leu 


gin 


gin 


leu 


ala 


gin 


CTG 


TGG 


AAG 


ACG 


GTC 


TCG 


CCG 


leu 


trp 


lys 


thr 


val 


ser 


pro 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



14/185 





















33/11 


















TCG CGG 


TCA 


ACG 


AGG 


CCG 


AAT 


ACG 


GCG 


AGA 


TGT GGG 


CCC 


AAG 


ACG 


CCG 


CCG 


CGA 


TGT 


TTG 


ser arg 
63/21 


ser 


thr 


arg 


pro 


asn 


thr 


ala 


arg 


cys gly 
93/31 


pro 


lys 


thr 


pro 


pro 


arg 


cys 


leu 


GCT ACG 


CCG 


CGG 


CGA 


CGG 


CGA 


CGG 


CGA 


CGG 


CGA CGT 


TGC 


TGC 


CGT 


TCG 


AGG 


AGG 


CGC 


CGG 


ala thr 
123/41 


pro 


arg 


arg 


arg 


arg 


arg 


arg 


arg 


arg arg 
153/51 


cys 


cys 


arg 


ser 


arg 


arg 


arg 


arc 


AG A TGA 


CCA 


GCG 


CGG 


GTG 


GGC 


TCC 


TCG 


AGC 


AGG CCG 


CCG 


CGG 


TCG 


AGG 


AGG 


CCT 


CCG 


ACA 


arg OPA 
183/61 


pro 


ala 


arg 


val 


gly 


ser 


ser 


ser 


arg pro 
213/71 


pro 


arg 


ser 


arg 


arg 


pro 


pro 


thr 


CCG CCG 


CGG 


CGA 


ACC 


AGT 


TGA 


TGA 


ACA 


ATG 


TGC CCC 


AGG 


CGC 


TGC 


AAC 


AGC 


TGG 


CCC 


AGC 


pro pro 
243/81 


arg 


arg 


thr 


ser 


OPA 


OPA 


thr 


met 


cys pro 
273/91 


arg 


arg 


cys 


asn 


ser 


trp 


pro 


ser 


CCA CGC 


AGG 


GCA 


CCA 


CGC 


CTT 


CTT 


CCA 


AGC 


TGG GTG 


GCC 


TGT 


GGA 


AGA 


CGG 


TCT 


CGC 


CGC 


pro arg 
303/101 


arg 


ala 


pro 


arg 


leu 


leu 


pro 


ser 


trp val 


ala 


cys 


gly 


arg 


arg 


ser 


arg 


arg 


ATC GGT 


CGC 


CGA 


TC 






























ile gly 


arg 


arg 

































SEQ ID N° 5C 
FIGURE 5C 



partie de la sequence nucleotidique Seq 5A 



1/1 


















31/11 


















CGC CGC 


GGC 


GAC 


GGC 


GAC 


GGC 


GAC 


GGC 


GAC 


GTT GCT 


GCC 


GTT 


CGA 


GGA 


GGC 


GCC 


GGA 


GAT 


arg arg 


gly 


asp 


gly 


asp 


gly 


asp 


gly 


asp 


val ala 


ala 


val 


arg 


gly 


gly 


ala 


gly 


asp 


61/21 


















91/31 












GAC CAG 


CGC 


GGG 


TGG 


GCT 


CCT 


CGA 


GCA 


GGC 


CGC CGC 


GGT 


CGA 


GGA 


GGC 


CTC 


CGA 


CAC 


CGC 


asp gin 


arg 


gly 


trp 


ala 


pro 


arg 


ala 


gly 


arg arg 


gly 


arg 


gly 


gly 


leu 


arg 


his 


arg 


121/41 


















151/51 














CGC GGC 


GAA 


CCA 


GTT 


GAT 


GAA 


CAA 


TGT 


GCC 


CCA GGC 


GCT 


GCA 


ACA 


GCT 


GGC 


CCA 


GCC 


CAC 


arg gly 


glu 


pro 


val 


asp 


glu 


gin 


cys 


ala 


pro gly 


ala 


ala 


thr 


ala 


gly 


pro 


ala 


his 


181/61 


















271/71 














GCA GGG 


CAC 


CAC 


GCC 


TTC 


TTC 


CAA 


GCT 


GGG 


TGG CCT 


GTG 


GAA 


GAC 


GGT 


CTC 


GCC 


GCA 


TCG 


ala gly 


his 


his 


ala 


phe 


phe 


gin 


ala 


gly 


trp pro 


val 


glu 


asp 


gly 


leu 


ala 


ala 


ser 



241/81 

GTC GCC GAT C 
val ala asp 



SEQ ID N° 5A' 
FIGURE 5A' 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



15/185 



1/1 31/11 



TAC GCC 


GCG 


GCG 


ACG 


GCG 


ACG 


GCG 


ACG 


GCG 


ACG TTG 


CTG 


CCG 


TTC 


GAG 


GAG 


GCG 


CCG 


GAG 


tyr ala 


ala 


ala 


thr 


ala 


thr 


ala 


thr 


ala 


thr leu 


leu 


pro 


phe 


glu 


glu 


ala 


pro 


glu 


61/21 






























ATG ACC 


AGC 


GCG 


GGT 


GGG 


CTC 


CTC 


GAG 


CAG 


GCC GCC 


GCG 


GTC 


GAG 


GAG 


GCC 


TCC 


GAC 


ACC 


met thr 


ser 


ala 


gly 


gly 


leu 


leu 


glu 


gin 


ala ala 


ala 


val 


glu 


glu 


ala 


ser 


asp 


thr 


121/41 


















151/51 












GCC GCG 


GCG 


AAC 


CAG 


TTG 


ATG 


AAC 


AAT 


GTG 


CCC CAG 


GCG 


CTG 


CAA 


CAG 


CTG 


GCC 


CAG 


CCC 


ala ala 


ala 


asn 


gin 


leu 


met 


asn 


asn 


val 


pro gin 


ala 


leu 


gin 


gin 


leu 


ala 


gin 


pro 


181/61 


















211/71 












ACG CAG 


GGC 


ACC 


ACG 


CCT 


TCT 


TCC 


AAG 


CTG 


GGT GGC 


CTG 


TGG 


AAG 


ACG 


GTC 


TCG 


CCG 


CAT 


thr gin 


Ql V 


thr 


thr 


pro 


ser 


ser 


lys 


leu 


gly gly 


leu 


trp 


lys 


tnr 


val 


ser 


pro 


his 


241/81 






























CGG TCG 


CCG 


ATC 
































arg ser 


pro 


ile 














































SEQ ID 


N° 5B' 
































FIGURE 5B ! 


















1/1 


















31/11 


















ACG CCG 


CGG 


CGA 


CGG 


CGA 


CGG 


CGA 


CGG 


CGA 


CGT TGC 


TGC 


CGT 


TCG 


AGG 


AGG 


CGC 


CGG 


AGA 


thr pro 


arg 


arg 


arg 


arg 


arg 


arg 


arg 


arg 


arg cys 


cys 


arg 


ser 


arg 


arg 


arg 


arg 


arg 


61/21 


















91/31 










TGA CCA 


GCG 


CGG 


GTG 


GGC 


TCC 


TCG 


AGC 


AGG 


CCG CCG 


CGG 


TCG 


AGG 


AGG 


CCT 


CCG 


ACA 


CCG 


OPA pro 


ala 


arg 


val 


gly 


ser 


ser 


ser 


arg 


pro pro 


arg 


ser 


arg 


arg 


pro 


pro 


thr 


pro 


121/41 


















151/51 












CCG CGG 


CGA 


ACC 


AGT 


TGA 


TGA 


ACA 


ATG 


TGC 


CCC AGG 


CGC 


TGC 


AAC 


AGC 


TGG 


CCC 


AGC 


CCA 


pro arg 


arg 


thr 


ser 


OPA 


OPA 


thr 


met 


cys 


pro arg 


arg 


cys 


asn 


ser 


trp 


pro 


ser 


pro 


181/61 


















211/71 












CGC AGG 


GCA 


CCA 


CGC 


CTT 


CTT 


CCA 


AGC 


TGG 


GTG GCC 


TGT 


GGA 


AGA 


CGG 


TCT 


CGC 


CGC 


ATC 


arg arg 


ala 


pro 


arg 


leu 


leu 


pro 


ser 


trp 


val ala 


cys 


gly 


arg 


arg 


ser 


arg 


arg 


ile 


241/81 



























GGT CGC CGA TC 
gly arg arg 



SEQ ID N° 5C 
FIGURE 5C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



16/185 



ORF predite 
1/1 


par 


Cole et 


tga act 
OPA thr 
61/21 


gat 
asp 


gat 
asp 


tct 
ser 


gat 
asp 


caa cga 
gin arg 
121/41 


ggc 
gly 


cga 
arg 


ata 
ile 


egg 
arg 


cgc ggc 
arg gly 
181/61 


gac 
asp 


ggc 
gly 


gac 
asp 


ggc 
gly 


cag cgc 
gin arg 
241/81 


ggg 

gly 


tgg 
trp 


get 
ala 


cct 
pro 


ggc gaa 
gly glu 
301/101 


cca 
pro 


gtt 
val 


gat 
asp 


gaa 
glu 


ggg cac 
gly his 
361/121 


cac 
his 


gcc 
ala 


ttc 
phe 


ttc 
phe 


gcc gat 
ala asp 
421/141 


cag 
gin 


caa 
gin 


cat 
his 


ggt 
gly 


gtc gat 
val asp 
481/161 


gac 
asp 


caa 
gin 


cac 
his 


ctt 
leu 


ggc cgt 
gly arg 
541/181 


gca 
ala 


aac 
asn 


cgc 
arg 


ggc 
gly 


ggg ttc 
gly phe 
601/201 


ttc 
phe 


ggg 

gly 


tct 
ser 


ggg 

gly 


ttc gtt 
phe val 
661/221 


gtc 
val 


ggt 
gly 


gcc 
ala 


gca 
ala 


ggc get 
gly ala 
721/241 


gcc 
ala 


get 
ala 


gac 
asp 


cag 
gin 


egg get 
arg ala 
781/261 


gcc 
ala 


ggt 
gly 


ggg 

gly 


gca 
ala 


tgt tec 
cys ser 
841/281 


gcc 
ala 


gcg 
ala 


acc 
thr 


eta 
leu 


cag act 
gin thr 


gtc 
val 


gtt 
val 


att 
ile 


tga 
OPA 



al. 


(Nature 


393 


537-544) 


et 










31/11 




age 


gac 


caa 


cct 


ctt ggg 


gca 


ser 


asp 


gin 


pro 


leu gly 


ala 










91/31 




cga 


gat 


gtg 


ggc 


cca aga 


cgc 


arg 


asp 


val 


gly 


pro arg 


arg 










151/51 




gac 


ggc 


gac 


gtt 


get gcc 


gtt 


asp 


gly 


asp 


val 


ala ala 


val 










211/71 




cga 


gca 


ggc 


cgc 


cgc ggt 


cga 


arg 


ala 


gly 


arg 


arg gly 


arg 










271/91 




caa 


tgt 


gcc 


cca 


ggc get 


gca 


gin 


cys 


ala 


pro 


gly ala 


ala 










331/111 




caa 


get 


ggg 


tgg 


cct gtg 


gaa 


gin 


ala 


gly 


trp 


pro val 


glu 










391/131 




gtc 


gat 


ggc 


caa 


caa cca 


cat 


val 


asp 


gly 


gin 


gin pro 


his 










451/151 




gag 


etc 


gat 


gtt 


gaa ggg 


ctt 


glu 


leu 


asp 


val 


glu gly 


leu 










511/171 




gca 


aaa 


egg 


ggt 


ccg ggc 


gat 


ala 


lys 


arg 


gly 


pro gly 


asp 










571/191 




egg 


tgg 


ggt 


ggc 


cgc caa 


ctt 


arg 


trp 


gly 


gly 


arg gin 


leu 










631/211 




ggc 


ctg 


ggc 


cgc 


ggc caa 


cca 


gly 


leu 


gly 


arg 


gly gin 


pro 










691/231 




cct 


gac 


cag 


cgc 


cgc gga 


aag 


pro 


asp 


gin 


arg 


arg gly 


lys 










751/251 




gat 


ggg 


cgc 


cag 


ggc egg 


tgg 


asp 


gly 


arg 


gin 


gly arg 


trp 










811/271 




tgt 


gat 


gcc 


gca 


ttc tec 


ggc 


cys 


asp 


ala 


ala 


phe ser 


gly 



SEQ ID N° 5F 
FIGURE 5F 



contenant seq5A' 

aaa cac ccc ggc gat cgc ggt 

lys his pro gly asp arg gly 

cgc cgc gat gtt tgg eta cgc 

arg arg asp val trp leu arg 

cga gga ggc gcc gga gat gac 

arg gly gly ala gly asp asp 

gga ggc etc cga cac cgc cgc 

gly gly leu arg his arg arg 

aca get ggc cca gcc cac gca 

thr ala gly pro ala his ala 

gac ggt etc gcc gca teg gtc 

asp gly leu ala ala ser val 

gtc gat gac caa etc ggg tgt 

val asp asp gin leu gly cys 

tgc tec ggc ggc ggc cgc cca 

cys ser gly gly gly arg pro 

gag etc get ggg cag etc get 

glu leu ala gly gin leu ala 

ggg teg ggc ggc etc ggt egg 

gly ser gly gly leu gly arg 

ggc agt cac ccc ggc ggc gcg 

gly ser his pro gly gly ala 

agg gcc egg gca gat get ggg 

arg ala arg ala asp ala gly 

tgg yet cag tgg tgt get gcg 

trp ala gin trp cys ala ala 

ggc egg eta gga gag ggg gcg 

gly arg leu gly glu gly ala 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



17/185 



sequence Rvll96 predite par 
ORF en fusion avec SeqSA' 

1/1 31/11 
atg gtg gat ttc ggg gcg tta cca ccg gag ate aac 
Met val asp phe gly ala leu pro pro glu ile asn 
61/21 91/31 
ggt teg gec teg ctg gtg gec gcg get cag atg tgg 
gly ser ala ser leu val ala ala ala gin met trp 
121/41 151/51 
teg gec gcg teg gcg ttt cag teg gtg gtc tgg ggt 
ser ala ala ser ala phe gin ser val val trp gly 
181/61 211/71 
teg teg gcg ggt ctg atg gtg gcg gcg gee teg ccg 
ser ser ala gly leu met val ala 
ala ala ser pro tyr val ala trp met ser val thr 
241/81 271/91 
gcg ggg cag gec gag ctg acc gec gec cag gtc egg gtt 
ala gly gin ala glu leu thr ala ala gin val arg val 
301/101 331/111 
gcg tat ggg ctg acg gtg ccc ccg ccg gtg ate gee 
ala tyr gly leu thr val pro pro pro val ile ala 
361/121 391/131 
ctg ata gcg acc aac etc ttg ggg caa aac acc ccg 
leu ile ala thr asn leu leu gly gin asn thr pro ala 
421/141 451/151 
tac ggc gag atg tgg gec caa gac gec gec gcg atg ttt 
tyr gly glu met trp ala gin asp ala ala ala met phe 
481/161 511/171 
acg gcg acg gcg acg ttg ctg ccg ttc gag gag gcg ccg 
thr ala thr ala thr leu leu pro phe glu glu ala pro 
541/181 571/191 
etc etc gag cag gec gec gcg gtc gag gag gee tec gac 
leu leu glu gin ala ala ala val glu glu ala ser asD 
601/201 631/211 
atg aac aat gtg ccc cag gcg ctg caa cag ctg gee cag 
met asn asn val pro gin ala leu gin gin leu ala gin 
661/221 691/231 
tct tec aag ctg ggt ggc ctg tgg aag acg gtc teg ccg 
ser ser lys leu gly gly leu trp lys thr val ser pro 
721/241 751/251 
atg gtg teg atg gec aac aac cac atg teg atg acc aac 
met val ser met ala asn asn his met ser met thr asn 
781/261 811/271 
acc ttg age teg atg ttg aag ggc ttt get ccg gcg gcg 
thr leu ser ser met leu lys gly phe ala pro ala ala 
841/281 871/291 
gcg gcg caa aac ggg gtc egg gcg atg age teg ctg ggc 
ala ala gin asn gly val arg ala met ser ser leu gly 
901/301 931/311 
ctg ggc ggt ggg gtg gec gec aac ttg ggt egg gcg gec 
leu gly gly gly val ala ala asn leu gly arg ala ala 
961/321 991/331 
ccg cag gec tgg gec gcg gec aac cag gca gtc acc ccg 
pro gin ala trp ala ala ala asn gin ala val thr oro 
1021/341 1051/351^ 
acc age ctg acc age gec gcg gaa aga ggg ccc ggg cag 
thr ser leu thr ser ala ala glu arg gly pro glv gin 
1081/361 1111/371 
ggg cag atg ggc gec agg gec ggt ggt ggg etc agt ggt 
gly gin net gly ala arg ala gly gly gly leu ser glv 
1141/381 1171/391 
ccc tat gtg atg ccg cat tct ccg gcg gec ggc tag 
pro tyr val met pro his ser pro ala ala gly AM3 



Cole et al. (Nature 393:537-544) et pouvant coder pour une 



tec gcg agg atg tac gec ggc ccg 

ser ala arg met tyr ala gly pro 

gac age gtg gcg agt gac ctg ttt 

asp ser val ala ser asp leu phe 

ctg acg gtg ggg teg tgg ata ggt 

leu thr val gly ser trp ile gly 

tat gtg gcg tgg atg age gtc acc 



gag 
glu 

gcg 



get gcg gcg 
ala ala ala 

aac cgt get 
asn arg ala 

ate gcg gtc 
ile ala val 

ggc tac gee 
gly tyr ala 

gag atg acc 
glu met thr 

acc gee gcg 
thr ala ala 

ccc acg cag 
pro thr gin 

cat egg teg 
his arg ser 

teg ggt gtg 
ser gly val 

gec gec cag 
ala ala gin 

age teg ctg 
ser ser leu 

teg gtc ggt 
ser val gly 

gcg gcg egg 
ala ala arg 

atg ctg ggc 
met leu gly 

gtg ctg cgt 
val lea arg 



gee tac 
ala tyr 

gaa ctg 
glu leu 

aac gag 
asn glu 

gcg gcg 
ala ala 

age gcg 
ser ala 

gcg aac 
ala asn 

ggc acc 
gly thr 

ccg ate 
pro ile 

teg atg 
ser met 

gee gtg 
ala val 

ggt tct 
gly ser 

teg ttg 
ser leu 

gcg ctg 
ala leu 

ggg ctg 
gly leu 



gtt ccg 
val oro 



gag acg 
glu thr 

atg att 
met ile 

gee gaa 
ala glu 

acg gcg 
thr ala 

ggt ggg 
gly gly 

cag ttg 
gin leu 

acg cct 
thr pro 

age aac 
ser asn 

acc aac 
thr asn 

caa acc 
gin thr 

teg ggt 
ser gly 

teg gtg 
ser val 

ccg ctg 
pro leu 

ccg gtg 
pro val 

ccg cga 
pro arg 



SEQ ID N° 5R 



FIGURE 5R 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



18/185 



Seq SP: 


ORF 


d 1 apres 


Cole et 


al. 


(Nature 


1/1 


















tag gga 


cac 


gt a 


atg 


gtg 


gat 


ttc 


ggg 


gcg 


AMB gly his 


val 


met 


val 


asp 


phe 


gly 


ala 


61/21 


















tac gcc 


ggc 


ccg 


ggt 


teg 


gcc 


teg 


ctg 


gtg 


tyr ala 


gly 


pro 


gly 


ser 


ala 


ser 


leu 


val 


121/41 


















agt gac 


ctg 


tt t 


teg 


gcc 


gcg 


teg 


gcg 


ttt 


ser asp 


leu 


phe 


ser 


ala 


ala 


ser 


ala 


phe 


181/61 
















teg tgg 


ata 


ggt 


teg 


teg 


gcg 


ggt 


ctg 


atg 


ser trp 


ile 


gly 


ser 


ser 


ala 


gly 


leu 


met 


241/81 


















atg age 


gtc 


acc 


gcg 


ggg 


cag 


gcc 


gag 


ctg 


met ser 


val 


thr 


ala 


gly 


gin 


ala 


glu 


leu 


301/101 


















gcc tac 


gag 


acg 


gcg 


tat 


ggg 


ctg 


acg 


gtg 


ala tyr glu 


tnr 


ala 


tyr 


gly 


leu 


thr 


val 


361/121 


















gaa ctg 


atg 


at t 


c g 


ata 


gcg 


acc 


aac 


etc 


glu leu 


met 


lie 


leu 


ile 


ala 


thr 


asn 


leu 


421/141 


















aac gag 


gcc 


gaa 




ggc 


gag 


atg 


tgg 


gcc 


asn glu 


ala 


glu 


tyr 


gly 


glu met 


trp 


ala 


481/161 


















gcg gcg 


acg 


gcg 


acg 


gcg 


acg 


gcg 


acg 


ttg 


ala ala 


thr 


ala 


thr 


ala 


thr 


ala 


thr 


leu 


541/181 


















age gcg 


ggt 


99g 


cue 


etc 


gag 


cag 


gcc 


gcc 


3er ala 


gly 


giy 


leu 


leu 


glu 


gin 


ala 


ala 


601/201 


















gcg aac 


cag 




atg 


aae 


aat 


gtg 


ccc 


cag 


ala asn 


gin 


leu 


me t 


asn 


asn 


val 


pro 


gin 


661/221 
















ggc acc 


acg 


cc t 


CC L 


tec 


aag 


ctg 


ggt 


ggc 


gly thr thr 


pro 


ser 


ser 


lys 


leu 


gly 


gly 


721/241 


















ccg ate 


age 


aac 


atg 


gtg 


teg 


atg 


gcc 


aac 


pro ile 


ser 


asn 


met 


val 


ser 


met 


ala 


asn 


781/261 


















teg atg 


acc 


aac 


acc 


ttg 


age 


teg 


atg 


ttg 


ser met 


thr 


asn 


thr 


leu 


ser 


ser 


met 


leu 


841/281 


















gcc gtg 


caa 


acc 


gcg 


gcg 


caa 


aac 


ggg 


gtc 


ala val 


gin 


thr 


ala 


ala 


gin 


asn 


gly 


val 


901/301 


















ggt tct 


teg 


ggt 


ctg 


ggc 


ggt 


ggg 


gtg 


gcc 


gly ser 


ser 


gly 


leu 


gly 


gly gly val 


ai a 


961/321 


















teg ttg 


teg 


gtg 


ccg 


cag 


gcc 


tgg 


gcc 


gcg 


ser leu 


ser 


val 


pro 


gin 


ala 


trp 


ala 


ala 


1021/341 
















gcg ctg 


ccg 


ctg 


acc 


age 


ctg 


acc 


age 


gcc 


ala leu 


pro 


leu 


thr 


ser 


leu 


thr 


ser 


ala 


1081/361 1111/371 












ggg ctg 


ccg 


gtg 


ggg 


cag 


atg 


ggc 


gcc 


agg 


gly leu 


pro 


val 


giy 


gin 


met 


gly 


ala 


arg 


1141/38 


L 














gtt ccg 


ccg 


cga 


ccc 


tat 


gtg 


atg 


ccg 


cat 


val pro 


pro 


arg 


pro 


tyr 


val 


met 


pro 


his 



393:537-544) et contenant la sequence Rvll96 



31/11 



tta cca 


ccg 


gag 


ate 


aac 


tec 


y*-y 


agg 


atg 


leu pro 


pro 


glu 


ile 


asn 


ser 


ala 


ara 


met 


91/31 
















gcc gcg 


get 


cag 


atg 


tan 


ga c 


age 


gtg 


gcg 


ala ala 


ala 


gin 


met 


trp 


asp 


ser 


val 


ala 


151/51 
















cag teg 


gtg 


gtc 


tgg 


ggt 


ctg 


acg 


gtg 


ggg 


gin ser 


val 


val 


trp 


gly 


leu 


thr 


val 


gly 


211/71 
















gtg gcg 


gcg 


gcc 


teg 


ccg 


tat 


gtg 


gcg 


tgg 


val ala 


ala 


ala 


ser 


pro 


tyr 


val 


ala 


trp 


271/91 
















acc gcc 


gcc 


cag 


gtc 


egg 


gtt 


get 


gcg 


gcg 


thr ala 


ala 


gin 


val 


arg 


val 


ala 


ala 


ala 


331/111 
















ccc ccg 


ccg 


gtg 


ate 


gcc 


gag 


aac 


cgt 


get 


pro pro 


pro 


val 


ile 


ala 


glu 


asn 


arg 


ala 


391/131 














ttg ggg 


caa 


aac 


acc 


ccg 


gcg 


ate 


gcg 


gtc 


leu gly 


gin 


asn 


thr 


pro 


ala 


ile 


ala 


val 



451/151 

caa gac gcc gcc gcg atg ttt ggc tac gcc 
gin asp ala ala ala met phe gly tyr ala 
511/171 



ctg ccg ttc gag gag gcg ccg gag atg acc 

leu pro phe glu glu ala pro glu met thr 
571/191 

gcg gtc gag gag gcc tec gac acc gcc gcg 

ala val glu glu ala ser asp thr ala ala 
631/211 

gcg ctg caa cag ctg gcc cag ccc acg cag 

ala leu gin gin leu ala gin pro thr gin 
691/231 

ctg tgg aag acg gtc teg ccg cat egg teg 

leu trp ly3 thr val ser pro hi3 arg ser 
751/251 

aac cac atg teg atg acc aac teg ggt gtg 

asn hi3 met ser met thr asn ser gly val 
811/271 

aag ggc ttt get ccg gcg gcg gcc gcc cag 

lys gly phe ala pro ala ala ala ala gin 
871/291 

egg gcg atg age teg ctg ggc age teg ctg 

arg ala met ser ser leu gly ser ser leu 
931/311 

gcc aac ttg ggt egg gcg gcc teg gtc ggt 

ala asn leu gly arg ala ala ser val gly 
991/331 

gcc aac cag gca gtc acc ccg gcg gcg egg 

ala asn gin ala val thr oro ala ala arg 
1051/351 

gcg gaa aga ggg ccc ggg cag atg ctg ggc 

ala glu arg gly pro gly gin met leu gly 

gcc ggt ggt ggg etc agt ggt gtg ctg cgt 
ala gly gly gly leu ser gly val leu arg 
1171/391 

tct ccg gcg gcc ggc tag 
ser pro ala ala gly AMB 



SEQ ID N° 5P 



FEUILLE DE REM^lSlffiEftEfi? (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



19/185 



GGA TCC 


TGA 


TGC 


AAG 


TGG 


TCC 


GGG 


ATT 


TGT 


gly ser 


OPA 


cys 


lys 


trp 


ser 


gly 


ile 


cys 


61/21 
















TTG GTG 


CAT 


CCG 


GGC 


TGC 


GAG 


CAT 


GCA 


CGC 


leu val 


his 


pro 


gly 


cys 


glu 


his 


ala 


arg 


121/41 
















CTT GCC 


CAC 


TGT 


TCC 


TCC 


CTG 


CCG 


GCA 


CCA 


leu ala 


his 


cys 


ser 


ser 


leu 


pro 


ala 


pro 


181/61 














GCG GTG 


CCT 


GGG 


CAT 


CCA 


GCA 


AAA 


CGG 


GGA 


ala val 


pro 


gly his 


pro 


ala 


lys 


arg 


gly 


241/81 


















TCA CCA 


ACG 


TCG 


AAA 


CCG 


ACG 


GTT 


GCC 


AGC 


ser pro 


thr 


ser 


lys 


pro 


thr 


val 


ala 


ser 


301/101 


















GCT GTA 


CCC 


TCA 


CCG 


AAC 


GTG 


AGT 


CCC 


ACA 


ala val 


pro 


ser 


pro 


asn 


val 


ser 


pro 


thr 


361/121 
















GCA GCC 


GAG 


CTC 


AAG 


GTG 


TCC 


CGC 


ACC 


ACT 


ala ala 


glu 


leu 


lys 


val 


ser 


arg 


thr 


thr 


421/141 
















GAA GGA 


GAA 


GAT 


c 












glu gly 


glu 


asp 















31/11 


















CGG CAG 


CCA 


CCG 


CGG 


TCC 


CGT 


CGA 


CCA 


ACG 


arg gin 
91/31 


pro 


arg 


arg 


ser 


ara 


arg 


pro 


thr 


ACC GAC 


CAG 


CGC 


GGC 


GAG 


CGC 


GGC 


TAG 


CTG 


thr asp 
151/51 


gin 


arg 


gly 


glu 


ara 


crl v 


AMB 


leu 


TGT GCG 


ACA 


AGC 


TTA 


AGC 


GCA 


GCA 


GTA 


CCG 


cys ala 
211/71 


thr 


ser 


leu 


ser 


ala 


ala 


va 1 


pro 


GCT CAA 


GAA 


CGA 


TTC 


ATG 


AAC 


GAG 


GGG 


TCG 


ala gin 
271/91 


glu 


arg 


phe 


met 


asn 


glu 


gly 


sec 


CGG CCC 


ACG 


ATA 


TTG 


CGT 


GCT 


CGA 


GGG 


TCC 


arg pro 
331/111 


thr 


ile 


leu 


arg 


ala 


arg 


gly 


ser 


CCG CGG 


AGG 


CGG 


GCG 


ACT 


CTG 


GCG 


TCG 


TTA 


pro arg 
391/131 


arg 


arg 


ala 


thr 


leu 


ala 


ser 


leu 


GTC TCG 


AAT 


GCT 


TTT 


AAC 


CGA 


CCG 


GAT 


CCA 


val ser 


asn 


ala 


phe 


asn 


arg 


pro 


asp 


pro 



SEQ ID N° 6A 
FIGURE 6A 



32/11 



GAT CCT 


GAT 


GCA 


AGT 


GGT 


CCG 


GGA 


TTT 


GTC 


GGC AGC 


CAC 


GGC 


GGT 


CCC 


GTC 


GAC 


CAA 


CGT 


asp pro 
62/21 


asp 


ala 


ser 


gly 


pro 


gly phe 


val 


gly ser 
92/31 


his 


gly 


gly 


pro 


val 


asp 


gin 


arg 


TGG TGC 


ATC 


CGG 


GCT 


GCG 


AGC 


ATG 


CAC 


GCA 


CCG ACC 


AGC 


GCG 


GCG 


AGC 


GCG 


GCT 


AGC 


TGC 


trp cys 
122/41 


ile 


arg 


ala 


ala 


ser 


met 


his 


ala 


pro thr 
152/51 


ser 


ala 


ala 


ser 


ala 


ala 


ser 


cys 


TTG CCC 


ACT 


GTT 


CCT 


CCC 


TGC 


CGG 


CAC 


CAT 


GTG CGA 


CAA 


GCT 


TAA 


GCG 


CAG 


CAG 


TAC 


CGG 


leu pro 
182/61 


thr 


val 


pro 


pro 


cys 


arg 


his 


his 


val arg 
212/71 


gin 


ala 


OCH 


ala 


gin 


gin 


tyr 


arg 


CGG TGC 


CTG 


GGC 


ATC 


CAG 


CAA 


AAC 


GGG 


GAG 


CTC AAG 


AAC 


GAT 


TCA 


TGA 


ACG 


AGG 


GGT 


CGT 


arg cys 
242/81 


leu 


gly 


ile 


gin 


gin 


asn 


gly 


glu 


leu lys 
272/91 


asn 


asp 


ser 


OPA 


thr 


arg 


gly 


arg 


CAC CAA 


CGT 


CGA 


AAC 


CGA 


CGG 


TTG 


CCA 


GCC 


GGC CCA 


CGA 


TAT 


TGC 


GTG 


CTC 


GAG 


GGT 


CCG 


his gin 
302/101 


arg 


arg 


asn 


arg 


arg 


leu 


pro 


ala 


gly pro 
332/111 


arg 


tyr 


cys 


val 


leu 


glu 


gly 


pro 


CTG TAC 


CCT 


CAC 


CGA 


ACG 


TGA 


GTC 


CCA 


CAC 


CGC GGA 


GGC 


GGG 


CGA 


CTC 


TGG 


CGT 


CGT 


TAG 


leu tyr 
362/121 


pro 


his 


arg 


thr 


OPA 


val 


pro 


his 


arg gly 
392/131 


gly 


gly 


arg 


leu 


trp 


arg 


arg 


AMB 


CAG CCG 


AGC 


TCA 


AGG 


TGT 


CCC 


GCA 


CCA 


CTG 


TCT CGA 


ATG 


CTT 


TTA 


ACC 


GAC 


CGG 


ATC 


CAG 


gin pro 

422/141 


ser 


ser 


arg 


cys 


pro 


ala 


pro 


leu 


ser arg 


me t 


leu 


leu 


+- u >- 


asp 


arg 


lie 


gin 


AAG GAG 


AAG 


ATC 
































lys glu 


lys 


lie 

































SEQ ID N° 6B 
FEUILLE DE REMpD&^k^ (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



20/185 



33/11 

ATC CTG ATG CAA GTG GTC CGG GAT TTG TCG GCA GCC ACG GCG GTC CCG TCG ACC AAC GTT 

ile leu met gin val val arg asp leu ser ala ala thr ala val pro ser thr asn val 
63/21 93/31 

GGT GCA TCC GGG CTG CGA GCA TGC ACG CAC CGA CCA GCG CGG CGA GCG CGG CTA GCT GCT 

gly ala ser gly leu arg ala cys thr his arg pro ala arg arg ala arg leu ala ala 
123/41 153/51 

TGC CCA CTG TTC CTC CCT GCC GGC ACC ATG TGC GAC AAG CTT AAG CGC AGC AGT ACC GGC 

cys pro leu phe leu pro ala gly thr met cys asp lys leu lys arg scr ser thr qlv 
183/61 213/71 

GGT GCC TGG GCA TCC AGC AAA ACG GGG AGC TCA AGA ACG ATT CAT GAA CGA GGG GTC GTC 

gly ala trp ala ser ser lys thr gly ser ser arg thr ile his glu arq gly val val 
243/81 273/91 

ACC AAC GTC GAA ACC GAC GGT TGC CAG CCG GCC CAC GAT ATT GCG TGC TCG AGG GTC CGC 
thr asn val glu thr asp gly cys gin pro ala his asp ile ala cys ser arq val arc 
303/101 333/111 9 

TGT ACC CTC ACC GAA CGT GAG TCC CAC ACC GCG GAG GCG GGC GAC TCT GGC GTC GTT AGC 

cys thr leu thr glu arg glu ser his thr ala glu ala glv asp ser gly val val ser 
363/121 393/131 

AGC CGA GCT CAA GGT GTC CCG CAC CAC TGT CTC GAA TGC TTT TAA CCG ACC GGA TCC AGA 

ser arg ala gin gly val pro his his cys leu glu cys she OCH pro thr qlv ser arq 
423/141 * * ' y 

AGG AGA AGA TC 
arg arg arg 



SEQ ID N° 6C 
FIGURE 6C 





















31/11 


















CCG TCG 


GCA 


ACT 


TGG 


CCG 


CTG 


AGG 


TCG 


GCT 


TGA TCC 


CTG 


GGC 


CGA 


GGC 


GGG 


TCA 


GCC 


AAT 


pro ser 


ala 


thr 


trp 


pro 


leu 


arg 


ser 


ala 


OPA ser 


leu 


gly 


a rg 


gly 


gly 


ser 


ala 


asn 


61/21 


















91/31 












AGC GGC 


TCC 


ATC 


GGC 


TTT 


GCT 


GGT 


AGC 


GGT 


TCG GCG 


GGA 


AGC 


TAG 


CGG 


CGA 


CGT 


TGT 


CGG 


ser gly 


ser 


ile 


gly 


phe 


ala 


gly 


ser 


gly 


ser ala 


gly 


ser 


AMB 


arg 


arg 


arg 


cys 


arg 


121/41 


















151/51 








TGG CCG 


GTG 


ATA 


TAT 


TCG 


GTC 


AGA 


CGG 


GTA 


TGG CGG 


CGG 


CTG 


AGG 


TGA 


TCT 


GCG 


ACA 


CGC 


trp pro 


val 


lie 


tyr 


trp 


val 


arg 


arg 


val 


trp arg 


arg 


leu 


arg 


OPA 


ser 


ala 


thr 


arg 


181/61 


















211/71 










CGC CGC 


GGT 


GCT 


CGA 


GCC 


AGG 


CTT 


ACG 


ACC 


AGG GAA 


TTT 


CGA 


AAA 


TGT 


TAT 


TCA 


GAA 


CAT 


arg arg 


gly 


ala 


arg 


ala 


arg 


leu 


thr 


thr 


arg glu 


phe 


arg 


lys 


cys 


tyr 


ser 


glu 


his 


241/81 


















271/91 










CTT GTA 


TCT 


CTT 


CTC 


CGT 


GCC 


ACC 


CCC 


TAG 


GTG TAG 


TGT 


TTT 


CGA 


GTA 


CCG 


GCA 


GAT 


CCC 


leu val 


ser 


leu 


leu 


arg 


ala 


thr 


pro 


AMB 


val AMB 


cys 


phe 


arg 


val 


pro 


ala 


asp 


p ro 


301/101 
































AGG TTC 


ACC 


AGG 


TCT 


CAC 


CAG 


ATC 
























arg phe 


thr 


arg 


ser 


his 


gin 


lie 

























SEQ ID N° 7A 
FIGURE 7A 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



21/185 



32/11 



CGT CGG 


CAA 


CTT 


GGC 


CGC 


TGA 


GGT 


CGG 


CTT 


GAT CCC 


TGG 


GCC 


GAG 


GCG 


GGT 


CAG 


CCA 


ATA 


arg arg 


gin 


leu 


gly 


arg 


OPA gly 


arg 


leu 


asp pro 


tro 


ala 


glu 


ala 




gin 


pro 


ire 


62/21 


















92/31 










GCG GCT 


CCA 


TCG 


GCT 


TTG 


CTG 


GTA 


GCG 


GTT 


CGG CGG 


GAA 


GCT 


AGC 


GGC 


GAC 


GTT 


GTC 


GGT 


ala ala 


pro 


ser 


ala 


leu 


leu 


val 


ala 


val 


arg arg 


glu 


ala 


ser 


gly 


asp 


val 


val 


al v 


122/41 


















152/51 












GGC CGG 


TGA 


TAT 


ATT 


GGG 


TCA 


GAC 


GGG 


TAT 


GGC GGC 


GGC 


TGA 


GGT 


GAT 


CTG 


CGA 


CAC 


GCC 


gly arg 


OPA 


tyr 


ile 


gly 


ser 


asp 


gly 


tyr 


gly gly 


y x y 


OPA gly 


asp 


leu 


a rg 


nis 


ala 


182/61 


















212/71 














GCC GCG 


GTG 


CTC 


GAG 


CCA 


GGC 


TTA 


CGA 


CCA 


GGG AAT 


TTC 


GAA 


AAT 


GTT 


ATT 


CAG 


AAC 


ATC 


ala ala 


val 


leu 


glu 


pro 


gly 


leu 


arg 


pro 


gly asn 


phe 


glu 


asn 


val 


ile 


gin 


asn 


ile 


242/81 


















272/91 
















TTG TAT 


CTC 


TTC 


TCC 


GTG 






CCT 


AGG 


TGT AGT 


GTT 


TTC 


GAG 


TAC 


CGG 


CAG 


ATC 


CCA 


leu tyr 


leu 


phe 


ser 


val 


pro 


pro 


pro 


arg 


cys ser 


va 1 


phe 


glu 


tyr 


arg 


gin 


ile 


pro 


302/101 


























GGT TCA 


CCA 


GGT 


CTC 


ACC 




TP 
























gly ser 


pro 




leu 


thr 


a rg 








































SEQ ID N° 7B 
































FIGURE 7B 




































33/11 


















GTC GGC 


AAC 


TTG 


GCC 


GCT 


GAG 


GTC 


GGC 


TTG 


ATC CCT 


GGG 


CCG 


AGG 


CGG 


GTC 


AGC 


CAA 


TAG 


val gly 


asn 


leu 


ala 


ala 


glu 


val 


gly 


leu 


ile pro 


al v 


pro 


arq 


arg 


va 1 




gin 


AMR 
/Al ID 


63/21 


















93/31 












CGG CTC 


CAT 


CGG 


CTT 


TGC 


TGG 


TAG 


CGG 


TTC 


GGC GGG 


AAG 


CTA 


GCG 


GCG 


ACG 


TTG 


TCG 


GTG 


arg leu 


his 


arg 


leu 


cys 


trp 


AMB 


arg 


phe 


gly gly 


lys 


leu 


ala 


ala 


thr 


leu 


ser 


val 


123/41 


















153/51 














GCC GGT 


GAT 


ATA 


TTG 


GGT 


CAG 


ACG 


GGT 


ATG 


GCG GCG 


GCT 


GAG 


GTG 


ATC 


TGC 


GAC 


ACG 


CCG 


ala gly 


asp 


ile 


leu 


gly 


gin 


thr 


gly 


met 


ala ala 


ala 


glu 


val 


ile 


cys 


asp 


thr 


pro 


183/61 


















213/71 












CCG CGG 


TGC 


TCG 


AGC 


CAG 


GCT 


TAC 


GAC 


CAG 


GGA ATT 


TCG 


AAA 


ATG 


TTA 


TTC 


AGA 


ACA 


TCT 


pro arg 


cys 


ser 


ser 


gin 


ala 


tyr 


asp 


gin 


gly ile 


ser 


lys 


met 


leu 


phe 


arg 


thr 


ser 


243/81 


















273/91 












TGT ATC 


TCT 


TCT 


CCG 


TGC 


CAC 


ccc 


CTA 


GGT 


GTA GTG 


TTT 


TCG 


AGT 


ACC 


GGC 


AGA 


TCC 


CAG 


cys ile 


ser 


ser 


pro 


cys 


his 


pro 


leu 


gly 


val val 


phe 


ser 


ser 


thr 




arg 


ser 


gin 


303/101 






























GTT CAC 


CAG 


GTC 


TCA 


CCA 


GAT 


c 
























val his 


gin 


val 


ser 


pro 


asp 



























SEQ ID N° 7C 
FIGURE 7C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



22/185 



CTT TGC GTG ATG 
leu cys val met 
61/21 

TAG TTT TCG CGA 
AMB phe ser arg 
121/41 

AGC GAA CCG TCG 
ser glu pro ser 
181/61 

CGT TCC TGG GTT 
arg ser trp val 
241/81 

GCG TCT TGG CTG 
ala ser trp leu 
301/101 

CGC GAA ACG TCA 
arg glu thr ser 
361/121 

ACG GTC GGG CGC 
thr val gly arg 
421/141 

TCG GCG ACG ATC 
ser ala thr ile 



TCC AAT GGC GAA 
ser asn gly glu 

TGA CGC TCG TTC 
OPA arg ser phe 

ATT CCA TGG GTG 
ile pro trp val 

CGA CAC CAT TCG 
arg his his ser 

CCG CCC CAC TAG 
pro pro his AMB 

CCG CGT TCG GGG 
pro arg ser gly 

CAT CGA CGC CGG 
his arg arg arg 







31/11 


AAC 


GAC 


GCC TTG 


asn 


asp 


ala leu 






91/31 


TGA 


CCG 


GAC TTG 


OPA 


pro 


asp leu 






151/51 


TCG 


ACG 


CAT TCG 


ser 


thr 


his ser 






211/71 


CCC 


AAA 


TCG ACC 


pro 


lys 


ser thr 






271/91 


CGA 


CTG 


CGC CGT 


arg 


leu 


arg arg 






331/111 


CAC 


CAG 


AGC ACG 


his 


gin 


ser thr 






391/131 


ACG 


AGG 


TCG CGG 


thr 


arg 


ser arg 



SEQ ID N° 8A 
FIGURE 8A 



TCA TCG CAA TCG 
ser ser gin ser 

TGA ACG GGT TTC 
OPA thr gly phe 

TGG TCA AGG CCG 
trp ser arg pro 

TGC CCC AGG TTG 
cys pro arg leu 

CGA CGA TCC GGC 
arg arg ser gly 

GAC CCG GCA TGC 
asp pro ala cys 

TGT CGA GCA CGC 
cys arg ala arg 



TCA GCA CCG GCC 
ser ala pro ala 

GGG TCG AGG CCG 
gly ser arg pro 

GCG CGG CAG GAC 
ala arg gin asp 

CTC GTG CGC CTG 
leu val arg leu 

AGG GCA CGT CAG 
arg ala arg gin 

CGC GGG TCT CGG 
arg gly ser arg 

TGG GCC GAA ACC 
trp ala glu thr 



TTT GCG TGA TGT CCA ATG 
phe ala OPA cys pro met 
62/21 

AGT TTT CGC GAT GAC GCT 
ser phe arg asp asp ala 
122/41 

GCG AAC CGT CGA TTC CAT 
ala asn arg arg phe his 
182/61 

GTT CCT GGG TTC GAC ACC 
val pro giy phe asp thr 
242/81 

CGT CTT GGC TGC CGC CCC 
arg leu gly cys arg pro 
302/101 

GCG AAA CGT CAC CGC GTT 
ala lys arg his arg val 
362/121 

CGG TCG GGC GCC ATC GAC 
arg ser gly ala ile asp 
422/141 

CGG CGA CGA TC 
arg arg arg 











32/11 




GCG 


AAA 


ACG 


ACG 


CCT TGT 


CAT 


ala 


lys 


thr 


thr 


pro cys 


his 










92/31 




CGT 


TCT 


GAC 


CGG 


ACT TGT 


GAA 


arg 


ser 


asp 


arg 


thr cys 


glu 










152/51 




GGG 


TGT 


CGA 


CGC 


ATT CGT 


GGT 


gly 


cys 


arg 


arg 


ile arg 


gly 










212/71 




ATT 


CGC 


CCA 


AAT 


CGA CCT 


GCC 


ile 


arg 


pro 


asn 


arg pro 


ala 










272/91 




ACT 


AGC 


GAC 


TGC 


GCC GTC 


GAC 


thr 


ser 


asp 


cys 


ala val 


asp 










332/111 




CGG 


GGC 


ACC 


AGA 


GCA CGG 


ACC 


arg 


gly 


thr 


arg 


ala arg 


thr 










392/131 




GCC 


GGA 


CGA 


GGT 


CGC GGT 


GTC 


ala 


gly 


a rg 


gly 


arg gly 


val 



CGC AAT CGT CAG CAC CGG CCT 
arg asn arg gin his arg pro 

CGG GTT TCG GGT CGA GGC CGA 
arg val ser gly arg gly arg 

CAA GGC CGG CGC GGC AGG ACC 
gin gly arg arg gly arg thr 

CCA GGT TGC TCG TGC GCC TGG 
pro gly cys ser cys ala trp 

GAT CCG GCA GGG CAC GTC AGC 
asp pro ala gly his val ser 

CGG CAT GCC GCG GGT CTC GGA 
arg his ala ala gly leu giy 

GAG CAC GCT GGG CCG AAA CCT 
glu his ala gly pro iys pro 



SEQ ID N° 8B 



FEUILLE DE REMFfcft££&E85 (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

23/185 



33/11 



TTG CGT 


GAT 


GTC 


CAA 


TGG 


CGA 


AAA 


CGA 


CGC 


CTT GTC 


ATC 


GCA 


ATC 


GTC 


AGC 


ACC 


GGC 


CTA 


leu arg 


asp 


val 


gin 


t rp 


arg 


lys 


arg 


arg 


leu val 


ile 


ala 


ile 


val 


ser 


thr 


crl v 


leu 


63/21 


















93/31 
















GTT TTC 


GCG 


ATG 


ACG 


CTC 


GTT 


CTG 


ACC 


GGA 


CTT GTG 


AAC 


GGG 


TTT 


CGG 


GTC 


GAG 


GCC 


GAG 


val phe 


ala 


met 


thr 


leu 


val 


leu 


thr 


gly 


leu val 


asn 


gly phe 


arg 


val 


alu 


ala 


glu 


123/41 


















153/51 












CGA ACC 


GTC 


GAT 


TCC 


ATG 


GGT 


GTC 


GAC 


GCA 


TTC GTG 


GTC 


AAG 


GCC 


GGC 


GCG 


GCA 


GGA 


CCG 


arg thr 


val 


asp 


ser 


met 


gly 


val 


asp 


ala 


phe val 


val 


lys 


ala 


alv 


ala 


ala 


n 1 v 
y ly 


pro 


183/61 


















213/71 












TTC CTG 


GGT 


TCG 


ACA 


CCA 


TTC 


GCC 


CAA 


ATC 


GAC CTG 


CCC 


CAG 


GTT 


GCT 




ccc 


CCT 


CCC 


phe leu 


gly 


ser 


thr 


pro 


phe 


ala 


gin 


ile 


asp leu 


pro 


gin 


val 


ala 


arg 


ala 


pro 


gly 


243/81 


















273/91 












GTC TTG 


GCT 


GCC 


GCC 


CCA 


CTA 


GCG 


ACT 


GCG 


CCG TCG 


ACG 


ATC 


CGG 


CAG 


GGC 


ACG 


TCA 


GCG 


val leu 


ala 


ala 


ala 


pro 


leu 


ala 


thr 


ala 


pro ser 


thr 


ile 


arg 


gin 


gly 


thr 


ser 


ala 


303/101 


















333/111 












CGA AAC 


GTC 


ACC 


GCG 


TTC 


GGG 


GCA 


CCA 


GAG 


CAC GGA 


CCC 


GGC 


ATG 


CCG 


CGG 


GTC 


TCG 


GAC 


arg asn 


val 


thr 


ala 


phe 


gly 


ala 


pro 


glu 


his gly 


pro 


gly 


met 


pro 


arg 


val 


ser 


asp 


363/121 


















393/131 










GGT CGG 


GCG 


CCA 


TCG 


ACG 


CCG 


GAC 


GAG 


GTC 


GCG GTG 


TCG 


AGC 


ACG 


CTG 


GGC 


CGA 


AAC 


CTC 


gly arg 


ala 


pro 


ser 


thr 


pro 


asp 


glu 


val 


ala val 


ser 


ser 


thr 


leu 


gly 


arg 


asn 


leu 


423/141 
































GGC GAC 


GAT 


C 
































gly asp 


asp 
















































SEQ ID N° 8C 
































FIGURE 8C 


















partie de la sequence nucleotidique 


de seq8A 


















1/1 


















31/11 


















CAG GTT 


GCT 


CGT 


GCG 


CCT 


GGC 


GTC 


TTG 


GCT 


GCC GCC 


CCA 


CTA 


GCG 


ACT 


GCG 


CCG 


TCG 


ACG 


gin val 


ala 


arg 


ala 


pro 


gly 


val 


leu 


ala 


ala ala 


pro 


leu 


ala 


thr 


ala 


pro 


ser 


thr 


61/21 


















91/31 












ATC CGG 


CAG 


GGC 


ACG 


TCA 


GCG 


CGA 


AAC 


GTC 


ACC GCG 


TTC 


GGG 


GCA 


CCA 


GAG 


CAC 


GGA 


CCC 


ile arg 


gin 


gly 


thr 


ser 


ala 


arg 


asn 


val 


thr ala 


phe 


gly 


ala 


pro 


glu 


his 


gly 


pro 


121/41 


















151/51 














GGC ATG 


CCG 


CGG 


GTC 


TCG 


GAC 


GGT 


CGG 


GCG 


CCA TCG 


ACG 


CCG 


GAC 


GAG 


GTC 


GCG 


GTG 


TCG 


gly met 


pro 


arg 


val 


ser 


asp 


gly 


arg 


ala 


pro ser 


thr 


pro 


asp 


glu 


val 


ala 


val 


ser 


181/61 






























AGC ACG 


CTG 


GGC 


CGA 


AAC 


CTC 


GGC 


GAC 


GAT 


C 


















ser thr 


leu 


gly 


arg 


asn 


leu 


gly 


asp 


asp 





















SEQ ID N° 8A' 
FIGURE 8A T 



FEUILLE DE R EMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



24/185 



1/1 


















31/11 


















AGG TTG 


CTC 


GTG 


CGC 


CTG 


GCG 


TCT 


TGG 


CTG 


CCG CCC 


CAC 


TAG 


CGA 


CTG 


CGC 


CGT 


CGA 


CGA 


arg leu 
61/21 


leu 


val 


arg 


leu 


ala 


ser 


trp 


leu 


pro pro 
91/31 


his 


AMB 


arg 


leu 


arg 


arg 


arg 


a rg 


TCC GGC 


AGG 


GCA 


CGT 


CAG 


CGC 


GAA 


ACG 


TCA 


CCG CGT 


TCG 


GGG 


CAC 


CAG 


AGC 


ACG 


GAC 


CCG 


ser gly 
121/41 


arg 


ala 


arg 


gin 


arg 


glu 


thr 


ser 


pro arg 
151/51 


ser 


gly 


his 


gin 


ser 


thr 


asp 


pro 


GCA TGC 


CGC 


GGG 


TCT 


CGG 


ACG 


GTC 


GGG 


CGC 


CAT CGA 


CGC 


CGG 


ACG 


AGG 


TCG 


CGG 


TGT 


CGA 


ala cys 
181/61 


arg 


gly 


ser 


arg 


thr 


val 


gly 


arg 


his arg 


a rg 


arg 


thr 


arg 


ser 


arg 


cys 


arg 


GCA CGC 


TGG 


GCC 


GAA 


ACC 


TCG 


GCG 


ACG 


ATC 




















ala arg 


trp 


ala 


glu 


thr 


ser 


ala 


thr 


ile 





















SEQ ID N° 8B' 
FIGURE 8B f 



Seq8C 



1/1 


















31/11 
















CCA GGT 


TGC 


TCG 


TGC 


GCC 


TGG 


CGT 


CTT 


GGC 


TGC CGC 


CCC 


ACT 


AGC 


GAC 


TGC 


GCC 


GTC 


pro gly 
61/21 


cys 


ser 


cys 


ala 


trp 


arg 


leu 


gly 


cys arg 
91/31 


pro 


thr 


ser 


asp 


cys 


ala 


val 


GAT CCG 


GCA 


GGG 


CAC 


GTC 


AGC 


GCG 


AAA 


CGT 


CAC CGC 


GTT 


CGG 


GGC 


ACC 


AGA 


GCA 


CGG 


asp pro 
121/41 


ala 


gly 


his 


val 


ser 


ala 


lys 


a rg 


his arg 
151/51 


val 


arg 


gly 


thr 


a rg 


ala 


arg 


CGG CAT 


GCC 


GCG 


GGT 


CTC 


GGA 


CGG 


TCG 


GGC 


GCC ATC 


GAC 


GCC 


GGA 


CGA 


GGT 


CGC 


GGT 


arg his 
181/61 


ala 


ala 


gly 


leu 


gly 


arg 


ser 


gly 


ala ile 


asp 


ala 


gly 


arg 


gly 


arg 


gly 


GAG CAC 


GCT 


GGG 


CCG 


AAA 


CCT 


CGG 


CGA 


CGA 


TC 
















glu his 


ala 


gly 


pro 


lys 


pro 


arg 


arg 


arg 



















SEQ ID N° 8C T 
FIGURE 8C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



25/185 

sequence Rv2563 predite par Cole et al . (Nature 393:537-544) et contenant seq8A' 

atg 
met 

121/41 151/51 

ctt ttt gcg get ttg cgt gat gtc caa tgg cga aaa cga cgc ctt gtc ate gca ate gtc 
leu phe ala ala leu arg asp val gin trp arg lys arg arg leu val ile ala ile val 
181/61 211/71 

age acc ggc eta gtt ttc gcg atg acg etc gtt ctg ace gga ctt gtg aac ggg ttt egg 
ser thr gly leu val phe ala met thr leu val leu thr gly leu val asn gly phe arg 
241/81 271/91 

gtc gag gec gag cga acc gtc gat tec atg ggt gtc gac gca ttc gtg gtc aag gec ggc 
val glu ala glu arg thr val asp ser met gly val asp ala phe val val lys ala gly 
301/101 331/111 

gcg gca gga ccg ttc ctg ggt teg aca cca ttc gec caa ate gac ctg ccc cag gtt get 
ala ala gly pro phe leu gly ser thr pro phe ala gin ile asp leu pro gin val ala 
361/121 391/131 

cgt gcg cct ggc gtc ttg get gec gee cca eta gcg act gcg ccg teg acg ate egg cag 
arg ala pro gly val leu ala ala ala pro leu ala thr ala pro ser thr ile arg gin 
421/141 451/151 

ggc acg tea gcg cga aac gtc acc gcg ttc ggg gca cca gag cac gga ccc ggc atg ccg 
gly thr ser ala arg asn val thr ala phe gly ala pro glu his gly pro glv met oro 
481/161 511/171 

egg gtc teg gac ggt egg gcg cca teg acg ccg gac gag gtc gcg gtg teg age acg ctg 
arg val ser asp gly arg ala pro ser thr pro asn glu val ala val ser ser thr leu 
541/181 571/191 

ggc cga aac etc ggc gac gat ctg caa gtg ggt gcg cgc act ttg egg ate gtc ggc ate 
gly arg asn leu gly asp asp leu gin val gly ala arg thr leu arg ile val glv ile 
601/201 631/211 

gtg ccc gag tea acc gcg ctg gca aag att ccc aac ate ttc ctg acc acc gaa ggc eta 
val pro glu ser thr ala leu ala lys ile pro asn ile phe leu thr thr glu gly leu 
661/221 691/231 

cag cag ttg gca tac aac gga cag ccg aca ate agt teg ate ggg ate gac ggg atg ccc 
gin gin leu ala tyr asn gly gin pro thr ile ser ser ile gly ile asp glv met Dro 
721/241 751/251 

cga cag etc ccg gac ggc tat cag acc gtc aat cga gcg gac get gtc age gat ctg atg 
arg gin leu pro asp gly tyr gin thr val asn arg ala aso ala val ser aso leu met 
781/261 811/271 

cgc ccg ttg aag gtc gcg gtg gat gcg ate acg gtt gtg gcg gtc ttg ctg tgg ate gtt 
arg pro leu lys val ala val asp ala ile thr val val ala val leu leu tro lie val 
841/281 871/291 

gcg gcg ttg ate gtc ggc teg gtg gtc tac etc tct gcg ttg gag egg ctg cgt gac ttt 
ala ala leu ile val gly ser val val tyr leu ser ala leu glu arg leu arg asp phe 
901/301 931/311 

gcg gtg ttc aag gcg ate ggc gtg ccg acg cgc teg att ctg gec ggg ctg gcg ctg cag 
ala val phe lys ala ile gly val pro thr arg ser ile leu ala gly leu ala leu gin 
961/321 991/331 

gcg gtc gtc gtc gcg ctg etc gcg gcg gtg gtt ggc ggc ate ctt teg ctg etc ttg gcg 
ala val val val ala leu leu ala ala val val gly gly lie leu ser leu le" leu ala 
1021/341 1051/351 

ccg ttg ttc ccg atg act gtc gtg gta ccc ctg agt gec ttc gtg gcg eta ccg gcg ate 
pro leu phe pro met thr val val val pro leu ser ala one val ala leu d-o a' a ^ 1 e 
1081/361 1111/371 

gcg act gtg ate ggt ctg ctg gec age gtc gca gga ctg egg cgc gtg gtg gcg ate gat 
ala thr val lie gly leu leu ala ser val ala gly leu arg arg val val a 1 a il<- aso 
1141/381 

ccg gca eta gcg ttc gga ggt ccc tag 
pro ala leu ala phe gly gly pro AM 3 

SEQ ID N° 8D 



FEUILLE DE REMF*LKfcgfflEfl?> (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



26/185 

ORF predite par_Cole et al . {Nature 393:537-544) et contenant Rv2563 

1/1 31/11 

tag gtt tea aga agg cct gtg cag gtt tec gca gec tgg gec gcg gcg cca ccg aag age 

AMB val ser arg arg pro val gin val ser ala ala trp ala ala ala pro pro lys ser 

61/21 91/31 

ccg ccg aaa tgg get aat egg gtt cgc ttg get cga teg ccg atg ate teg ace gee acg 

pro pro lys trp ala asn arg val arg leu ala arg ser pro met ile ser thr ala thr 

121/41 151/51 

ace gac ccc etc ace teg gtc gaa cct egg cga ace aac gcg gca acg cca gee cat gat 

thr asp pro leu thr ser val glu pro arg arg thr asn ala ala thr pro ala his asp 

181/61 211/71 

cat ttg att ggg tec acg gaa gca ggt age ttc cgt cgc atg ctt ttt gcg get ttg cgt 

his leu ile gly ser thr glu ala gly ser phe arg arg met leu phe ala ala Leu arq 

241/81 271/91 

gat gtc caa tgg cga aaa cga cgc ctt gtc ate gca ate gtc age ace ggc eta gtt ttc 

asp val gin trp arg lys arg arg leu val ile ala ile val ser thr gly leu val phe 

301/101 331/111 

gcg atg acg etc gtt ctg ace gga ctt gtg aac ggg ttt egg gtc gag gee gag cga acc 

ala met thr leu val leu thr gly leu val asn gly phe arg val glu ala glu arq thr 

361/121 391/131 

gtc gat tec atg ggt gtc gac gca ttc gtg gtc aag gec ggc gcg gca gga ccg ttc ctg 

val asp ser met gly val asp ala phe val val lys ala gly ala ala gly pro phe leu 

421/141 451/151 

ggt teg aca cca ttc gec caa ate gac ctg ccc cag gtt get cgt gcg cct ggc gtc ttg 

gly ser thr pro phe ala gin ile asp leu pro gin val ala arg ala pro gly val leu 

481/161 511/171 

get gec gec cca eta gcg act gcg ccg teg acg ate egg cag ggc acg tea gcg cga aac 

ala ala ala pro leu ala thr ala pro ser thr ile arg gin gly thr ser ala arg asn 

541/181 571/191 

gtc acc gcg ttc ggg gca cca gag cac gga ccc ggc atg ccg egg gtc teg gac ggt egg 

val thr ala phe gly ala pro glu his gly pro gly met pro arg val ser asp gly arq 

601/201 631/211 

gcg cca teg acg ccg gac gag gtc gcg gtg teg age acg ctg ggc cga aac etc ggc gac 

ala pro ser thr pro a3p glu val ala val ser ser thr leu gly arg asn leu gly asD 

661/221 6917231 

gat ctg caa gtg ggt gcg cgc act ttg egg ate gtc ggc ate gtg ccc gag tea acc gcg 

asp leu gin val gly ala arg thr leu arg ile val gly ile val pro glu ser thr ala 

721/241 751/251 

ctg gca aag att ccc aac ate ttc ctg acc acc gaa ggc eta cag cag ttg gca tac aac 

leu ala lys ile pro asn ile phe leu thr thr glu gly leu gin gin leu ala tyr asn 

781/261 811/271 

gga cag ccg aca ate agt teg ate ggg ate gac ggg atg ccc cga cag etc ccg gac ggc 

gly gin pro thr ile ser ser ile gly ile a3p gly met pro arg gin leu pro asp gly 

841/281 871/291 

tat cag acc gtc aat cga gcg gat get gtc age gat ctg atg cgc ccg ttg aag gtc gcg 

tyr gin thr val asn arg ala asp ala val ser asp leu met arg pro leu lys val ala 

901/301 931/311 

gtg gat gcg ate acg gtt gtg gcg gtc ttg ctg tgg ate gtt gcg gcg ttg ate gtc ggc 

val asp ala lie thr val val ala val leu leu trp ile val ala ala leu ile val gly 

961/321 991/331 

teg gtg gtc tac etc tct gcg ttg gag egg ctg cgt gac ttt gcg gtg ttc aag gcg ate 

ser val val tyr leu ser ala leu glu arg leu arg asp phe ala val phe lys ala ile 

1021/341 1051/351 

ggc gtg ccg acg cgc teg att ctg gec ggg ctg gcg ctg cag gcg gtc gtc gtc gcg erg 

gly val pro thr arg ser ile leu ala gly leu ala leu gin ala val val val ala leu 

1081/361 1111/371 

etc gcg gcg gtg gtt ggc ggc ate ctt teg ctg ctg ttg gcg ccg ttg ttc ccg atg act 

leu ala ala val val gly gly ile leu ser leu leu leu ala oro leu phe pro met t'~ - 

1141/381 1171/391 

gtc gtg gta ccc ctg agt gec ttc gtg gcg eta ccg gcg ate gcg act gtg ate ggt ctg 

val val val pro leu ser ala phe val ala leu pro ala ile ala thr val lie gly leu 

1201/401 1231/411 

ctg gec age gtc gca gga ctg egg cgc gtg gtg gcg ate gat ccg gca eta gcg ttc gga 

leu ala ser val ala gly leu arg arg val val ala lie aso ore ala leu ala phe g 1 y 

1251/421 * 1 
ggt ccc tag 
gly pro AM 3 

SEQ ID N° 8F 
FEUILLE DE REMF*L58£BSlE8T (REGLE 26) 



WO 99/09186 



PCIYFR98/01813 



27/185 



sequence de Rv0072 predite par par Cole et 
presentant plus de 77% de similarite avec Seq8D* 
1/1 31/11 
atg etc ttc gcg gec ctg cgt gac atg caa tgg aga aag cgc 
Met leu phe ala ala leu arg asp met gin trp arg lys arg 
61/21 91/31 
ate age acc ggg ctg ate ttc ggg atg acg ctt gtt ttg ace 
ile ser thr gly leu ile phe gly met thr leu val leu thr 
121/41 151/51 
egg gtg gag gec egg cac acc gtc gat tec atg ggt gtc gat 
arg val glu ala arg his thr val asp ser met gly val asp 
181/61 211/71 
ggc get get gga cct ttt ctg ggt tea ata ccg ttt ccc gat 
gly ala ala gly pro phe leu gly ser ile pro phe pro asp 
241/81 271/91 
gee get gaa ccc ggt gtc atg gec gcg gec ccg ttg ggc age 
ala ala glu pro gly val met ala ala ala pro leu gly ser 
301/101 331/111 
gaa ggc acg teg acg cga aac gtc acg gtc ttc ggc gcg ccc 
glu gly thr ser thr arg asn val thr val phe gly ala pro 
361/121 391/131 
cca egg gtc tea gag ggt egg tea ccg teg aaa ccg gac gaa 
pro arg val ser glu gly arg ser pro ser lys pro asp glu 
421/141 451/151 
atg ggc cga cac etc ggt gac act gtc gag gtc ggc gcg cgc 
met gly arg his leu gly asp thr val glu val gly ala arg 
481/161 511/171 
att gtg ccg aat tec acc gcg ctg gee aag ate ccc aat gtc 
ile val pro asn ser thr ala leu ala lys ile pro asn val 
541/181 . 571/191 

tta cag aaa ttg gcg tac aac ggg cag ccg aat ate acg tec 
leu gin lys leu ala tyr asn gly gin pro asn ile thr ser 
601/201 631/211 
ccc cga cag ctg ccg gag ggt tac cag act ttc gat egg gtg 
pro arg gin leu pro glu gly tyr gin thr phe asp arg val 
661/221 691/231 
gtg cgc cca ttg aag gtc gca gtg aat teg ate teg ate gtg 
val arg pro leu lys val ala val asn ser ile ser ile val 



al. (Nature 393:537-544) et 



751/251 
gtg gtg tac ctt teg get 
tyr leu ser ala 
811/271 



721/241 

gtg gcg gtg ctg ate gtc ggc teg 

val ala val leu ile val gly ser val val 
781/261 

ttc gcg gtg ttc aag gcg att ggc acg cca acg cgc teg att 

phe ala val phe lys ala ile gly thr pro thr arg ser ile 
841/281 871/291 

cag gcg ctg gtc att gcg ttg ctt gcg gcg gtg gtg ggc gtc 

gin ala leu val ile ala leu leu ala ala val val gly val 



901/301 
gca cca ctg ttt ccg atg 



931/311 

gtc gcg gta ccc gtc ggt get 



991/331 

ctg ttc get agt gtt gec gga ttg 



ala pro leu phe pro met ile val ala val pro val gly ala 
961/321 

gec gcg ate gtc ate ggt 

ala ala ile val ile gly leu phe ala ser val ala civ leu 
1021/341 

gat ccc gcg cag gcg ttc gga ggt ccc tag 

asp pro ala gin ala phe gly gly pro AMB 



cgc ctg 
arg leu 

gga etc 
gly leu 

gta ttc 
val phe 

gtt gac 
val asp 

gtg ggg 
val gly 

gag cac 
glu his 

gtc gcg 
val ala 

aga ttg 
arg leu 

ttc etc 
phe leu 

ate ggg 
ile gly 

ggc get 
gly ala 

get gtt 
ala val 

ctt gag 
leu glu 

atg gee 
met ala 

gtc ctg 
val leu 

tac ctg 
tyr leu 

aag cgc 
lys arg 



gtc ate 
val ile 

gcg aac 
ala asn 

gtc gtc 
val val 

ctg gee 
leu ala 

acg ate 
thr ile 



gga cct 
gly pro 

gca teg 
ala ser 

egg gtc 
arg val 

acg acc 
thr thr 

ate ata 
ile ile 

gtc aat 
val asn 

ttg ctg 
leu leu 

egg eta 
arg leu 

ggg etc 
gly leu 

gcg cag 
ala gin 

gcg eta 
ala leu 

gtg gtg 
val val 



acg ate 
thr ile 

ggc ttc 
gly phe 

aga tec 
arg ser 

cga gtg 
arg val 

atg aaa 
met lys 

ggc atg 
gly met 

age acg 
ser thr 

gtt ggc 
val gly 

gag ggc 
glu gly 

ggt atg 
gly met 

gat ttg 
asp leu 

tgg att 
trp ile 

cgt gac 
arg asp 

gca tta 
ala leu 

gtg ttg 
val leu 

ccg gtg 
pro val 

acg gtc 
thr val 



SEQ ID N° 8G 



FEUILLE DE REMPtA©gMfc#F(REGLE 26) 



WO 99/09186 PCT/FR98/01813 



28/185 



3eq8H : 


ORF 


predite 


par 


Col< 


1/1 












tag cct 


ctg 


gga 


atg 


etc 


ttc 


AMB pro 


leu 


gly 


met 


leu 


phe 


61/21 












gtc ate 


acg 


ate 


ate 


age 


ace 


val ile 


thr 


ile 


ile 


ser 


thr 


121/41 












gcg aac 


ggc 


ttc 


egg 


gtg 


gag 


ala asn 


gly 


phe 


arg 


val 


glu 


181/61 












gtc gtc 


aga 


tec 


ggc 


get 


get 


val val 


arg 


ser 


gly 


ala 


ala 


241/81 












ctg gec 


cga 


gtg 


gec 


get 


gaa 


leu ala 


arg 


val 


ala 


ala 


glu 


301/101 










acg ate 


atg 


aaa 


gaa 


ggc 


acg 


thr ile 


met 


lys 


glu 


gly 


thr 


361/121 












gga cct 


ggc 


atg 


cca 


egg 


gtc 


gly pro 


gly 


met 


pro 


arg 


val 


421/141 












gca teg 


age 


acg 


atg 


ggc 


cga 


ala ser 


ser 


thr 


met 


gly 


arg 


481/161 












egg gtc 


gtt 


ggc 


att 


gtg 


ccg 


arg val 


val 


gly 


ile 


val 


pro 


541/181 












acg ace 


gag 


ggc 


tta 


cag 


aaa 


thr thr 


glu 


gly 


leu 


gin 


lys 


601/201 












ate ata 


ggt 


atg 


ccc 


cga 


cag 


ile ile 


gly 


met 


pro 


arg 


gin 


661/221 












gtc aat 


gat 


ttg 


gtg 


cgc 


cca 


val asn 


asp 


leu 


val 


arg 


pro 


721/241 












ttg ctg 


tgg 


att 


gtg 


gcg 


gtg 


leu leu 


trp 


ile 


val 


ala 


val 


781/261 












egg eta 


cgt 


gac 


ttc 


gcg 


gtg 


arg leu 


arg 


asp 


phe 


ala 


val 


841/281 












ggg etc 


gca 


tta 


cag 


gcg 


ctg 


gly leu 


ala 


leu 


gin 


ala 


leu 


901/301 












gcg cag 


gtg 


ttg 


gca 


cca 


ctg 


ala gin 


val 


leu 


ala 


pro 


leu 


961/321 










gcg eta 


ccg 


gtg 


gec 


gcg 


ate 


ala leu 


pro 


val 


ala 


ala 


ile 


1021/341 










gtg gtg 


acg 


gtc 


gat 


ccc 


gcg 


val val 


thr 


val 


asn 


pro 


ala 



et 


al. 


(Nature 393: 


537- 








31/11 




gcg 


gee 


ctg 


cgt gac 


atg 


ala 


ala 


leu 


arg asp 


met 








91/31 




ggg 


ctg 


ate 


ttc ggg 


atg 


gly 


leu 


ile 


phe gly met 








151/51 




gec 


egg 


cac 


ace gtc 


gat 


ala 


arg 


his 


thr val 


asp 








211/71 




gga 


cct 


ttt 


ctg ggt 


tea 


gly 


pro 


phe 


leu gly 


ser 








271/91 




ccc 


ggt 


gtc 


atg gee 


gcg 


pro 


gly 


val 


me t ala 


ala 








331/111 




teg 


acg 


cga 


aac gtc 


acg 


ser 


thr 


arg 


asn val 


thr 








391/131 




tea 


gag 


ggt 


egg tea 


ccg 


ser 


glu 


gly 


arg ser 


pro 








451/151 




cac 


etc 


ggt 


gac act 


gtc 


his 


leu 


gly 


asp thr 


val 








511/171 




aat 


tec 


ace 


gcg ctg 


gee 


asn 


ser 


thr 


aia leu 


ala 








571/191 




ttg 


gcg 


tac 


aac ggg 


cag 


leu 


ala 


tyr 


asn gly 


gin 








631/211 




ctg 


ccg 


gag 


ggt tac 


cag 


leu 


pro 


glu 


gly tyr 


gin 








691/231 




ttg 


aag 


gtc 


gca gtg 


aat 


leu 


lys 


val 


ala val 


asn 








751/251 




ctg 


ate 


gtc 


ggc teg 


gtg 


leu 


ile 


val 


gly ser 


val 








811/271 




ttc 


aag 


gcg 


att ggc 


acg 


phe 


lys 


ala 


ile qly 


thr 








871/291 




gtc 


att 


gcg 


ttg ctt 


gcg 


val 


ile 


ala 


leu leu 


ala 








931/311 




ttt 


ccg 


atg 


att gtc 


gcg 


phe 


pro 


met 


ile val 


ala 








991/331 




gtc 


ate 


ggt 


ctg ttc 


get 


val 


ile 


gly 


leu phe 


ala 








1051/35 




cag 


gcg 


ttc 


gga ggt 


ccc 


gin 


ala 


phe 


gly gly 


pro 



544) et contenant seq8G 



caa 
gin 


tgg 
trp 


aga 
arg 


aag 
lys 


cgc 
arg 


cgc 
arg 


ctg 
leu 


acg 
thr 


ctt 
leu 


gtt 
val 


ttg 
leu 


ace 
thr 


gga 
gly 


etc 
leu 


tec 
ser 


atg 
met 


ggt 
gly 


gtc 
val 


gat 
asp 


gta 
val 


ttc 
phe 


ata 

ile 


ccg 
pro 


ttt 
phe 


ccc 
pro 


gat 
asp 


gtt 
val 


gac 
asp 


gee 
ala 


ccg 
pro 


ttg 
leu 


ggc 
gly 


age 
ser 


gtg 
val 


ggg 

gly 


gtc 
val 


ttc 
phe 


ggc 
gly 


gcg 
ala 


ccc 
pro 


gag 
glu 


cac 
his 


teg 
ser 


aaa 
lys 


ccg 
pro 


gac 
asp 


gaa 
glu 


gtc 
val 


gcg 
ala 


gag 
glu 


gtc 
val 


ggc 
gly 


gcg 
ala 


cgc 
arg 


aga 
arg 


ttg 
leu 


aag 
lys 


ate 
lie 


ccc 
pro 


aat 
asn 


gtc 
val 


ttc 
phe 


etc 
leu 


ccg 
pro 


aat 
asn 


ate 
ile 


acg 
thr 


tec 
ser 


ate 
ile 


ggg 

gly 


act 
thr 


ttc 
phe 


gat 
asp 


egg 
arg 


gtg 
val 


ggc 
gly 


get 
ala 


teg 
ser 


ate 
ile 


teg 
ser 


ate 
ile 


gtg 
val 


get 
ala 


gtt 
val 


gtg 
val 


tac 
tyr 


ctt 
leu 


teg 
ser 


get 
ala 


ctt 
leu 


aaa 
glu 


cca 
pro 


acg 
thr 


cgc 
arg 


teg 
ser 


att 
ile 


atg 
met 


gec 
ala 


gcg 
ala 


gtg 

va 1 


gtg 

val 


ggc 
gly 


gtc 
val 


gtc 
val 


ctg 
leu 


gta 
val 


ccc 
pro 


gtc 
val 


ggt 
gly 


get 
ala 


tac 
tyr 


ctg 
leu 


ag t 
ser 


gtt 
val 


gec 
ala 


gga 
gly 


ttg 
leu 


aag 
lys 


cgc 
arg 



tag 
AM 3 



SEQ ID N° 8H 



FEUILLE DE REMffiK&SNfEfl* (REGLE 26) 



WO 99/09186 



PO7FR98/01813 



29/185 





















31/11 


















CGA GGC 


CGA 


GCG 


AAC 


CGT 


CGA 


TTC 


CAT 


GGG 


TGT CGA 


CGC 


ATT 


CGT 


GGT 


CAA 


GGC 


CGG 


CGC 


arg gly 


arg 


aia 


asn 


arg 


arg 


phe 


his 


gly 


cys arg 


arg 


ile 


arg 


qly 


gin 


ql v 


a rg 


arg 


61/21 


















91/31 










GGC AGG 


ACC 


GTT 


CCT 


GGG 


TTC 


GAC 


ACC 


ATT 


CGC CCA 


AAT 


CGA 


CCT 


GCC 


CCA 


GGT 


TCC 




gly arg 


thr 


val 


pro 


gly 


phe 


asp 


thr 


ile 


arg pro 


asn 


a rq 


oro 


aia 


pro 






ser 


121/41 


















151/51 












TGC GCC 


TGG 


CGT 


CTT 


GGC 


TGC 


CGC 


CCC 


ACT 


AGC GAC 


TGC 


GCC 


GTC 


GAC 


GAT 


CCG 


GCA 


GGG 


cys aia 


trp 


a rg 


leu 


gly 


cys 


arg 


pro 


thr 


ser asp 


cys 


aia 


val 


asp 


asp 


pro 


aia 


gly 


181/61 


















211/71 










CAC GTC 


AGC 


GCG 


AAA 


CGT 


CAC 


CGC 


GTT 


CGG 


GGC ACC 


AGA 


GCA 


CGG 


ACC 


CGG 


CAT 


GCC 


GCG 


his val 


ser 


aia 


lys 


arg 


his 


arq 


val 


arg 


gly thr 


a rg 


aia 


arg 


t-hr 


arg 


hi s 


aia 


aia 


241/81 


















271/91 














GGT CTC 


GGA 


CGG 


TCG 


GGC 


GCC 


ATC 


GAC 


GCC 


GGA CGA 


GGT 


CGC 


GGT 


GTC 


GAG 


CAC 


GCT 


GGG 


gly leu 


gly 


arg 


ser 


gly 


aia 


ile 


asp 


aia 


gly arg 


gly 


arg 


gly 


val 


glu 


his 


aia 


gly 


301/101 






























CCG AAA 


CCT 


CGG 


CGA 


CGA 


TC 


























pro lys 


pro 


arg 


arg 


arg 










































SEQ ID N° 9A 
































FIGURE 9A 




































32/11 


















GAG GCC 


GAG 


CGA 


ACC 


GTC 


GAT 


TCC 


ATG 


GGT 


GTC GAC 


GCA 


TTC 


GTG 


GTC 


AAG 


GCC 


GGC 


GCG 


glu aia 


glu 


arg 


thr 


val 


asp 


ser 


met 


gly 


val asp 


aia 


phe 


val 


val 


lys 


aia 


gly 


aia 


62/21 


















92/31 














GCA GGA 


CCG 


TTC 


CTG 


GGT 


TCG 


ACA 


CCA 


TTC 


GCC CAA 


ATC 


GAC 


CTG 


CCC 




\J 1 1 






aia gly 


pro 


phe 


leu 


gly 


ser 


thr 


pro 


phe 


aia gin 


ile 


asp 


leu 


pro 


gin 


val 


aia 


arg 


122/41 


















152/51 












GCG CCT 


GGC 


GTC 


TTG 


GCT 


GCC 


GCC 


CCA 


CTA 


GCG ACT 


GCG 


CCG 


TCG 


ACG 


ATC 


CGG 


CAG 


GGC 


aia pro 


gly 


val 


leu 


aia 


aia 


aia 


pro 


leu 


aia thr 


aia 


pro 


ser 


thr 


ile 


arg 


gin 


gly 


182/61 


















212/71 












ACG TCA 


GCG 


CGA 


AAC 


GTC 


ACC 


GCG 


TTC 


GGG 


GCA CCA 


GAG 


CAC 


GGA 


CCC 


GGC 


ATG 


CCG 


CGG 


thr ser 


aia 


arg 


asn 


val 


thr 


aia 


phe 


gly 


aia pro 


glu 


his 


gly 


pro 


gly 


met 


pro 


a rg 


242/81 


















272/91 














GTC TCG 


GAC 


GGT 


CGG 


GCG 


CCA 


TCG 


ACG 


CCG 


GAC GAG 


GTC 


GCG 


GTG 


TCG 


AGC 


ACG 


CTG 


GGC 


val ser 


asp 


gly 


arg 


aia 


pro 


ser 


thr 


pro 


asp glu 


val 


aia 


val 


ser 


ser 


thr 


leu 


gly 


302/101 





































CGA AAC CTC GGC GAC GAT C 
arg asn leu gly asp asp 



SEQ ID N° 9B 
FIGURE 9B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



30/185 



AGG CCG 


AGC 


GAA 


CCG 


TCG 


ATT 


arg pro 


ser 


glu pro 


ser 


ile 


63/21 












CAG GAC 


CGT 


TCC 


TGG 


GTT 


CGA 


gin asp 


arg 


ser 


trp 


val 


arg 


123/41 












CGC CTG 


GCG 


TCT 


TGG 


CTG 


CCG 


arg leu 


ala 


ser 


trp 


leu 


pro 


183/61 












CGT CAG 


CGC 


GAA 


ACG 


TCA 


CCG 


arg gin 


arg 


glu 


thr 


ser 


pro 


243/81 












TCT CGG 


ACG 


GTC 


GGG 


CGC 


CAT 


ser arg 


thr 


val 


gly 


arg 


his 


303/101 












GAA ACC 


TCG 


GCG 


ACG 


ATC 




glu thr. 


ser 


ala 


thr 


ile 





33/11 

CCA TGG GTG TCG ACG CAT TCG 

pro trp val ser thr his ser 
93/31 

CAC CAT TCG CCC AAA TCG ACC 

his his ser pro lys ser thr 
153/51 

CCC CAC TAG CGA CTG CGC CGT 

pro his AMB arg leu arg arg 
213/71 

CGT TCG GGG CAC CAG AGC ACG 

arg ser gly his gin ser thr 
273/91 

CGA CGC CGG ACG AGG TCG CGG 

arg arg arg thr arg ser arg 



TGG 


TCA 


AGG 


CCG 


GCG 


CGG 


trp 


ser 


arg 


pro 


ala 


arg 


TGC 


CCC 


AGG 


TTG 


CTC 


GTG 


cys 


pro 


arg 


leu 


leu 


val 


CGA 


CGA 


TCC 


GGC 


AGG 


GCA 


arg 


arg 


ser 


gly 


arg 


ala 


GAC 


CCG 


GCA 


TGC 


CGC 


GGG 


asp 


pro 


ala 


cys 


arg 


gly 


TGT 


CGA 


GCA 


CGC 


TGG 


GCC 


cys 


arg 


ala 


arg 


trp 


ala 



TTA ACG 


ACT 


CAG 


ACG 


GAA 


ACG 


leu thr 


thr 


gin 


thr 


glu 


thr 


61/21 












GCT CTT 


TGG 


CAA 


TTG 


AAG 


GTG 


ala leu 


trp 


gin 


leu 


lys 


val 


121/41 












ATC AAT 


CGC 


CGG 


CTC 


GCG 


GAC 


ile asn 


arg 


arg 


leu 


ala 


asp 


181/61 










GGG TCC 


TTT 


GTG 


ACT 


GCC 


GGG 


gly ser 


phe 


val 


thr 


ala 


gly 


241/81 










CTA CCG 


TTC 


TGA 


CCT 


GGG 


GCT 


leu pro 


phe 


OPA 


pro 


gly 


ala 


301/101 












GGC CCA 


CCG 


CCA 


CCT 


CGG 


TCG 


gly pro 


pro 


pro 


pro 


arg 


ser 


361/121 












CTT GTT 


CGC 


ATC 


GTT 


GGT 


GTC 


leu val 


arg 


ile 


val 


gly 


val 


421/141 












GGC GGT 


CGT 


GCC 


GCG 


CAT 


GCG 


gly gly 


arg 


ala 


ala 


his 


ala 



SEQ ID N° 9C 
FIGURE 9C 









31/11 






CTT 


GAA 


CCG 


CGA GGT 


CGC 


TCC 


leu 


glu 


pro 


arg gly 


arg 


ser 








91/31 






AGC 


TGC 


GAG 


CAG CCG 


GGT 


GAC 


ser 


cys 


glu 


gin pro 


gly 


asp 








151/51 






GTA 


GAT 


AAT 


CAG CTC 


ACC 


GTT 


val 


asp 


asn 


gin leu 


thr 


val 








211/71 






CTT 


GAC 


GCG 


GAC GAC 


CAC 


AGA 


leu 


asp 


ala 


asp asp 


his 


arg 








271/91 






GCG 


TGG 


GCG 


CCG ACG 


ACG 


TGA 


ala 


trp 


ala 


pro thr 


thr 


OPA 








331/111 






CCG 


GCA 


GTA 


TGT CAG 


CAT 


GTG 


pro 


ala 


val 


cys gin 


his 


val 








391/131 






GTG 


GTT 


GCG 


ACG ACC 


TTG 


GCG 


val 


val 


ala 


thr thr 


leu 


ala 



GAT C 
asp 



SEQ ID N° 10A 
FIGURE 10A 



GGA 


CAC 


CAA 


TTT 


GAC 


TCG 


gly 


his 


gin 


phe 


asp 


ser 


CGC 


ATC 


GTT 


GGC 


CTT 


GCC 


arg 


ile 


val 


gly 


leu 


ala 


GGG 


ACC 


GAC 


CTC 


GAC 


CAG 


gly 


thr 


asp 


leu 


asp 


gin 


GTC 


GGT 


CAT 


CGC 


CTA 


AGG 


val 


gly 


his 


arg 


leu 


arg 


GGC 


ACG 


TCA 


TGT 


CTC 


AGC 


gly 


thr 


ser 


cys 


leu 


ser 


CAG 


ATG 


ACT 


CCA 


CGC 


AGC 


gin 


met 


thr 


pro 


arg 


ser 


CTG 


GTG 


AGC 


GCA 


CCC 


GCC 


leu 


val 


ser 


ala 


pro 


ala 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



31/185 



TAA CGA CTC AGA CGG AAA 
OCH arg leu arg arg lys 
62/21 

CTC TTT GGC AAT TGA AGG 
leu phe gly asn OPA arg 
122/41 

TCA ATC GCC GGC TCG CGG 
ser ile ala gly ser arg 
182/61 

GGT CCT TTG TGA CTG CCG 
gly pro leu OPA leu pro 
242/81 

TAC CGT TCT GAC CTG GGG 
tyr arg ser asp leu gly 
302/101 

GCC CAC CGC GAC CTC GGT 
ala his arg his leu gly 
362/121 

TTG TTC GCA TCG TTG GTG 
leu phe ala ser leu val 
422/141 

GCG GTC GTG CCG CGC ATG 
ala val val pro arg met 



32/11 



CGC 


TTG 


AAC 


CGC 


GAG GTC 


GCT 


arg 


leu 


asn 


arg 


glu val 


ala 










92/31 




TGA 


GCT 


GCG 


AGC 


AGC CGG 


GTG 


OPA 


ala 


ala 


ser 


ser arg 


val 










152/51 




ACG 


TAG 


ATA 


ATC 


AGC TCA 


CCG 


thr 


AMB 


ile 


ile 


ser ser 


pro 










212/71 




GGC 


TTG 


ACG 


CGG 


ACG ACC 


ACA 


gly 


leu 


thr 


arg 


thr thr 


thr 










272/91 




CTG 


CGT 


GGG 


CGC 


CGA CGA 


CGT 


leu 


arg 


gly 


arg 


arg arg 


arg 










332/111 




CGC 


CGG 


CAG 


TAT 


GTC AGC 


ATG 


arg 


arg 


gin 


tyr 


val ser 


met 










392/131 




TCG 


TGG 


TTG 


CGA 


CGA CCT 


TGG 


ser 


trp 


leu 


arg 


arg pro 


trp 


CGG 


ATC 










arg 


Ile 











CCG GAC ACC AAT TTG ACT CGG 
pro asp thr asn leu thr arg 

ACC GCA TCG TTG GCC TTG CCA 
thr ala ser leu ala leu pro 

TTG GGA CCG ACC TCG ACC AGG 
leu gly pro thr ser thr arg 

GAG TCG GTC ATC GCC TAA GGC 
glu ser val ile ala OCH gly 

GAG GCA CGT CAT GTC TCA GCG 
glu ala arg his val ser ala 

TGC AGA TGA CTC CAC GCA GCC 
cys arg OPA leu his ala ala 

CGC TGG TGA GCG CAC CCG CCG 
arg trp OPA ala his pro pro 



AAC GAC TCA GAC GGA AAC 
asn asp ser asp gly asn 
63/21 

TCT TTG GCA ATT GAA GGT 
ser leu ala ile glu gly 
123/41 

CAA TCG CCG GCT CGC GGA 
gin ser pro ala arg gly 
183/61 

GTC CTT TGT GAC TGC CGG 
val leu cys asp cys arg 
243/81 

ACC GTT CTG ACC TGG GGC 
thr val leu thr trp gly 
303/101 

CCC ACC GCC ACC TCG GTC 
pro thr ala thr ser val 
363/121 

TGT TCG CAT CGT TGG TGT 
cys ser his arg trp cys 
423/141 

CGG TCG TGC CGC GCA TGC 
arg ser cys arg ala cys 



SEQ ID N° 10B 
FIGURE 10B 



33/11 

GCT TGA ACC GCG AGG TCG CTC 
ala OPA thr ala arg ser leu 
93/31 

GAG CTG CGA GCA GCC GGG TGA 
glu leu arg ala ala gly OPA 
153/51 

CGT AGA TAA TCA GCT CAC CGT 
arg arg OCH ser ala his arg 
213/71 

GCT TGA CGC GGA CGA CCA CAG 
ala OPA arg gly arg pro gin 
273/91 

TGC GTG GGC GCC GAC GAC GTG 
cys val gly ala asp asp val 

333/111 

GCC GGC AGT ATG TCA GCA TGT 
ala gly ser met ser ala cys 
393/131 

CGT GGT TGC GAC GAC CTT GGC 
arg gly cys asp asp leu gly 

GGA TC 
gly 



CGG ACA CCA ATT TGA CTC GGC 
arg thr pro ile OPA leu gly 

CCG CAT CGT TGG CCT TGC CAT 
pro his arg trp pro cys his 

TGG GAC CGA CCT CGA CCA GGG 
trp asp arg pro arg pro gly 

AGT CGG TCA TCG CCT AAG GCT 
ser arg ser ser pro lys ala 

AGG CAC GTC ATG TCT CAG CGG 
arg his val met ser gin arg 

GCA GAT GAC TCC ACG CAG CCT 
ala asp asp ser thr gin pro 

GCT GGT GAG CGC ACC CGC CGG 
ala gly glu arg thr arg arg 



SEQ ID N° 10C 



FEUILLE DE REmK^Se^^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



CCC GAA 


GAG 


GTC 


CCC 


CGT 


TTT 


pro glu 


glu 


val 


pro 


arg 


phe 


61/21 












AAG GCA 


TAA 


AAC 


CTA 


GTA 


CCT 


lys ala 


OCH 


asn 


leu 


val 


pro 


121/41 










GGG GCG 


TGC 


ATT 


CCG 


ACG 


ACC 


gly ala 


cys 


ile 


pro 


thr 


thr 


181/61 












ACG AAG 


GCC 


GAG 


CGA 


CGG 


GCT 


thr lys 


ala 


glu 


arg 


arg 


ala 


241/81 












CAC CAC 


CGC 


CCG 


CAC 


CCG 


ACC 


his his 


arg 


pro 


his 


pro 


thr 


301/101 












GCT GGA 


CAG 


CAT 


CGG 


TCC 


CCG 


ala gly 


gin 


hi 3 


arg 


ser 


pro 


361/121 












CAA CCC 


TTG 


AAC 


CGG 


GTC 


CCG 


gin pro 


leu 


asn 


arg 


val 


pro 


421/141 












AGA CAC 


AGG 


GCC 


ATG 


GAA 


ATC 


arg his 


arg 


ala 


met 


glu 


ile 


4 81/161 












CGG TCG 


CTG 


AGC 


TTC 


TAC 


CGT 


arg ser 


leu 


ser 


phe 


tyr 


arg 


CCG AAG 


AGG 


TCC 


CCC 


GTT 


TTG 


pro lys 


arg 


ser 


pro 


val 


leu 


62/21 












AGG CAT 


AAA 


ACC 


TAG 


TAC 


CTG 


arg his 


lys 


thr 


AMB 


tyr 


leu 


122/41 












GGG CGT 


GCA 


TTC 


CGA 


CGA 


CCC 


gly arg 


ala 


phe 


arg 


arg 


pro 


182/61 












CGA AGG 


ccG 


AGC 


GAC 


GGG 


CTG 


arg arg 


pro 


ser 


asp 


gly 


leu 


242/81 












ACC ACC 


GCC 


CGC 


ACC 


CGA 


CCG 


thr thr 


ala 


arg 


thr 


arg 


pro 


302/101 












CTG GAC 


AGC 


ATC 


GGT 


CCC 


CGC 


leu asp 


ser 


lie 


gly 


pro 


arg 


362/121 












AAC CCT 


TGA 


ACC 


GGG 


TCC 


CGG 


asn pro 


OPA 


thr 


gly 


se r 


arg 


422/141 












GAC ACA 


GGG 


CCA 


TGG 


AAA 


TCC 


asp thr 


gly 


pro 


trp 


1 ys 


ser 


482/161 












GGT CGC 


TGA 


GCT 


TCT 


ACC 


GTG 


gly arg 


OPA 


ala 


ser 


thr 


val 



32/185 

31/11 



GTT 


AAT 


TTT 


TAA AAA 


ATT 


TGT 


val 


asp phe 


OCH lys 


ile 


cys 








91/31 






GGG 


GCG 


GCG 


GAT TCA 


ACG 


AAA 


gly 


ala 


ala 


asp ser 


thr 


lys 








151/51 






CTG 


TAC 


GAC 


CCG CTG 


GTG 


GCA 


leu 


tyr 


asp 


pro leu 


val 


ala 








211/71 






GCC 


GGC 


GCT 


GAC CGC 


CGC 


GGA 


ala 


gly ala 


asp arg 


arg 


gly 








271/91 






GGT 


ACG 


GAT 


CGC GCC 


TCG 


GGT 


gly thr 


asp 


arg ala 


ser 


gly 








331/111 






CTG 


GGT 


CAA 


TGC ACT 


CAT 


GCA 


leu 


gly gin 


cys thr 


his 


ala 








391/131 






GCC 


TGC 


CGA 


CCC TCG 


GCC 


GCC 


ala 


cys 


arg 


pro ser 


ala 


ala 








451/151 






CTG 


GCC 


AGC 


CGG ATG 


CTA 


CTT 


leu 


ala 


ser 


arg met 


leu 


leu 


GAC 


CAG 


ATC 








asp 


gin 


ile 









SEQ ID N° HA 
FIGURE 11A 









32/11 






TTA 


ATT 


TTT 


AAA AAA 


TTT 


GTG 


leu 


ile 


phe 


lys ly3 


phe 


val 








92/31 






GGG 


CGG 


CGG 


ATT CAA 


CGA 


AAA 


gly 


arg 


arg 


lie gin 


arg 


lys 








152/51 






TGT 


ACG 


ACC 


CGC TGG 


TGG 


CAA 


cys 


thr 


thr 


arg trp 


trp 


gin 








212/71* 






CCG 


GCG 


CTG 


ACC GCC 


GCG 


GAA 


pro 


ala 


leu 


thr ala 


ala 


glu 








272/91 






GTA 


CGG 


ATC 


GCG CCT 


CGG 


GTT 


val 


arg 


ile 


ala pro 


arg 


val 








332/111 






TGG 


GTC 


AAT 


GCA CTC 


ATG 


CAG 


trp 


val 


asn 


ala leu 


net 


gin 








392/131 






CCT 


GCC 


GAC 


CCT CGG 


CCG 


CCG 


pro 


ala 


asp 


pro arg 


pro 


pro 








452/151 






TGG 


CCA 


GCC 


GGA TGC 


TAC 




trp 


pro 


ala 


gly cys 


tyr 


phe 


ACC 


AGA 


TC 








thr 


arg 











SEQ ID N° 11B 



GTC 


ACA 


AAC 


CGG 


GGT 


ACC 


val 


thr 


lys 


arg 


gly 


thr 


ACC 


GAG 


TGG 


GGG 


TAG 


TCA 


thr 


glu 


trp 


gly 


AMB 


ser 


ACG 


CCG 


ATG 


AGT 


GCG 


CCG 


thr 


pro 


met 


ser 


ala 


pro 


AGC 


CGC 


CGA 


GTG 


CAT 


GGT 


ser 


arg 


arg 


val 


asp 


gly 


TAC 


CGT 


CGC 


CGT 


CAA 


CGC 


tyr 


arg 


arg 


arg 


gin 


arg 


GCG 


CCG 


CAA 


CGA 


ACA 


GCT 


did 


pro 


gin 


arg 


thr 


ala 


GGC 


GTG 


CCG 


CTA 


CGT 


GAT 


qly 


val 


pro 


leu 


arg 


asp 


CGG 


CCG 


GCG 


GAC 


TAT 


CAG 


arg 


pro 


ala 


asp 


tyr 


gin 


TCA 


CAA 


AGC 


GGG 


GTA 


CCA 


ser 


gin 


se r 


gly 


val 


pro 


CCG 


AGT 


GGG 


GGT 


AGT 


CAG 


pro 


ser 


gly 


gly 


ser 


gin 


CGC 


CGA 


TGA 


GTG 


CCC 


CGA 


arg 


arg 


OPA 


val 


arg 


arg 


GCC 


GCC 


GAG 


TGG 


ATG 


GTC 


ala 


ala 


glu 


trp 


met 


val 


ACC 


GTC 


GCC 


GTC 


ACC 


GCG 


thr 


val 


ala 


val 


asn 


ala 


CGC 


CGC 


AAC 


GAA 


CAG 


CTC 


a rg 


arg 


asn 


glu 


gin 


leu 


GCG 


TGC 


CGC 


TAC 


GTG 


ATA 


ala 


cys 


arg 


tyr 


val 


lie 


GCC 


CGG 


CGG 


ACT 


ATC 


AGC 


gly 


arg 


arg 


thr 


lie 


ser 



FIGURE 11B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



33/185 



33/11 



CGA AGA 


GGT 


CCC 


CCG 


TTT 


TGT 


TAA 


TTT 


TTA 


AAA AAT 


TTG 


TGT 


CAC 


AAA 


GCG 


GGG 


TAC 


CAA 


arg arg 


gly 


pro 


pro 


phe 


cys 


OCH 


phe 


leu 


lys asn 


leu 


cys 


his 


lys 


ala 


gly 


tyr 


gin 

^ it 


63/21 


















93/31 










GGC ATA 


AAA 


CCT 


AGT 


ACC 


TGG 


GGC 


GGC 


GGA 


TTC AAC 


GAA 


AAC 


CGA 


GTG 


GGG 


GTA 


GTC 


AGG 


gly ile 


lys 


pro 


ser 


thr 


trp 


gly 


gly 


gly 


phe asn 


glu 


asn 


arg 


val 


gly 


val 


val 


arq 


123/41 


















153/51 














GGC GTG 


CAT 


TCC 


GAC 


GAC 


CCT 


GTA 


CGA 


CCC 


GCT GGT 


GGC 


AAC 


GCC 


GAT 


GAG 


TGC 


GCC 


GAC 


gly val 


his 


ser 


asp 


asp 


pro 


val 


arg 


pro 


ala gly 


gly 


asn 


ala 


asp 


glu 


cys 


ala 


asp 


183/61 


















213/71 










GAA GGC 


CGA 


GCG 


ACG 


GGC 


TGC 


CGG 


CGC 


TGA 


CCG CCG 


CGG 


AAG 


CCG 


CCG 


AGT 


GGA 


TGG 


TCA 


glu gly 


arg 


ala 


thr 


gly 


cys 


arg 


arg 


OPA 


pro pro 


arg 


lys 


pro 


pro 


ser 


q1 v 


t ro 


ser 


243/81 


















273/91 












CCA CCG 


CCC 


GCA 


CCC 


GAC 


CGG 


TAC 


GGA 


TCG 


CGC CTC 


GGG 


TTA 


CCG 


TCG 


CCG 


TCA 


ACG 


CGC 


pro pro 


pro 


ala 


pro 


asp 


arg 


tyr 


gly 


ser 


arg leu 


gly 


leu 


pro 


ser 


pro 


ser 


thr 


arg 


303/101 


















333/111 














TGG ACA 


GCA 


TCG 


GTC 


CCC 


GCT 


GGG 


TCA 


ATG 


CAC TCA 


TGC 


AGC 


GCC 


GCA 


ACG 


AAC 


AGC 


TCA 


trp thr 


ala 


ser 


val 


pro 


ala 


gly 


ser 


met 


his ser 


cys 


ser 


ala 


ala 


thr 


asn 


ser 


ser 


363/121 


















393/131 














ACC CTT 


GAA 


CCG 


GGT 


CCC 


GGC 


CTG 


CCG 


ACC 


CTC GGC 


CGC 


CGG 


CGT 


GCC 


GCT 


ACG 


TGA 


TAG 


thr leu 


glu 


pro 


gly 


pro 


gly 


leu 


pro 


thr 


leu gly 


arg 


arg 


arg 


ala 


ala 


thr 


OPA 


AMB 


423/141 


















453/151 














ACA CAG 


GGC 


CAT 


GGA 


AAT 


CCT 


GGC 


CAG 


CCG 


GAT GCT 


ACT 


TCG 


GCC 


GGC 


GGA 


CTA 


TCA 


GCG 


thr gin 


gly 


his 


gly 


asn 


pro 


gly 


gin 


pro 


asp ala 


thr 


ser 


ala 


gly 


gly 


leu 


ser 


ala 


483/161 
































GTC GCT 


GAG 


CTT 


CTA 


CCG 


TGA 


CCA 


GAT 


C 




















val ala 


glu 


leu 


leu 


pro 


OPA 


pro 


asp 




































SEQ ID 


N° 11C 






























FIGURE 11C 


















partie de la sequence nucleotidique 


de Seall 


















1/1 


















31/11 


















CGT CGC 


CGT 


CAA 


CGC 


GCT 


GGA 


CAG 


CAT 


CGG 


TCC CCG 


CTG 


GGT 


CAA 


TGC 


ACT 


CAT 


GCA 


GCG 


arg arg 


arg 


gin 


arg 


ala 


gly 


gin 


his 


arg 


ser pro 


leu 


gly 


gin 


cys 


thr 


hi s 


ala 


ala 


61/21 


















91/31 












CCG CAA 


CGA 


ACA 


GCT 


CAA 


CCC 


TTG 


AAC 


CGG 


GTC CCG 


GCC 


TGC 


CGA 


CCC 


TCG 


GCC 


GCC 


GGC 


pro gin 


arg 


thr 


ala 


gin 


pro 


leu 


asn 


arg 


val pro 


ala 


cys 


arg 


pro 


ser 


ala 


ala 


gly 


121/41 


















151/51 










GTG CCG 


CTA 


CGT 


GAT 


AGA 


CAC 


AGG 


GCC 


ATG 


GAA ATC 


CTG 


GCC 


AGC 


CGG 


ATG 


CTA 


CTT 


CGG 


val pro 


leu 


arg 


asp 


arg 


his 


arg 


ala 


met 


glu ile 


leu 


ala 


ser 


arg 


met 


leu 


leu 


arg 


181/61 


















211/71 
















CCG GCG 


GAC 


TAT 


CAG 


CGG 


TCG 


CTG 


AGC 


TTC 


TAC CGT 


GAC 


CAG 


ATC 












pro ala 


asp 


tyr 


gin 


arg 


ser 


leu 


ser 


phe 


tyr arg 


asp 


glr. 


ile 













SEQ ID N° 11A' 
FIGURE 11A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



34/185 

1/1 31/11 



GTC GCC 


GTC 


AAC 


GCG 


CTG 


GAC 


AGC 


ATC 


GGT 


CCC CGC 


TGG 


GTC 


AAT 


GCA 


CTC 


ATG 


CAG 


CGC 


val ala 
61/21 


val 


asn 


ala 


leu 


asp 


ser 


lie 


gly 


pro arg 
91/31 


trp 


val 


asn 


ala 


leu 


met 


gin 


arg 


CGC AAC 


GAA 


CAG 


CTC 


AAC 


CCT 


TGA 


ACC 


GGG 


TCC CGG 


CCT 


GCC 


GAC 


CCT 


CGG 


CCG 


CCG 


GCG 


arg asn 
121/41 


glu gin leu 


asn 


pro 


OPA 


thr 


gly 


ser arg 
151/51 


pro 


ala 


asp 


pro 


arg 


pro 


pro 


ala 


TGC CGC 


TAC 


GTG 


ATA 


GAC 


ACA 


GGG 


CCA 


TGG 


AAA TCC 


TGG 


CCA 


GCC 


GGA 


TGC 


TAC 


TTC 


GGC 


cys arg 
181/61 


tyr 


val 


ile 


asp 


thr 


gly pro 


trp 


lys ser 
211/71 


trp 


pro 


ala 


gly cys 


tyr 


phe 


gly 


CGG CGG 


ACT 


ATC 


AGC 


GGT 


CGC 


TGA 


GCT 


TCT 


ACC GTG 


ACC 


AGA 


TC 












arg arg 


thr 


ile 


ser 


gly arg OPA ala 


ser 


thr val 


thr 


arg 






























SEQ 


ID N° 


11B' 






























FIGURE 11B' 
















1/1 


















31/11 


















TCG CCG 


TCA 


ACG 


CGC 


TGG 


ACA 


GCA 


TCG 


GTC 


CCC GCT 


GGG 


TCA 


ATG 


CAC 


TCA 


TGC 


AGC 


GCv^ 


ser pro 
61/21 


ser 


thr 


arg 


trp 


thr 


ala 


ser 


val 


pro ala 
91/31 


gly 


ser 


met 


his 


ser 


cys 


ser 


ala 


GCA ACG 


AAC 


AGC 


TCA 


ACC 


CTT 


GAA 


CCG 


GGT 


CCC GGC 


CTG 


CCG 


ACC 


CTC 


GGC 


CGC 


CGG 


CGT 


ala thr 
121/41 


asn 


ser 


ser 


thr 


leu 


glu 


pro 


gly 


pro gly 
151/51 


leu 


pro 


thr 


leu 


gly 


arg 


arg 


arg 


GCC GCT 


ACG 


TGA 


TAG 


ACA 


CAG 


GGC 


CAT 


GGA 


AAT CCT 


GGC 


CAG 


CCG 


GAT 


GCT 


ACT 


TCG 


GCC 


ala ala 
181/61 


thr 


OPA 


AMB 


thr 


gin 


gly his 


gly 


asn pro 
211/71 


gly 


gin pro 


asp 


ala 


thr 


ser 


ala 


GGC GGA 


CTA 


TCA 


GCG 


GTC 


GCT 


GAG 


CTT 


CTA 


CCG TGA 


CCA 


GAT 


C 












gly gly 


leu 


ser 


ala 


val 


ala 


glu 


leu 


leu 


pro OPA 


pro 


asp 















SEQ ID N° 11C 
FIGURE 11C 1 



sequence Rv0546c predite par par Cole et al. (Nature 393:537-544) et contenant SeqllA 



1/1 31/11 



atg gaa 


ate 


ctg 


gec 


age 


egg 


atg 


eta 


ctt 


egg ccg 


gcg 


gac 


tat 


cag 


egg 


teg 


ctg 


age 


Met glu 


ile 


leu 


ala 


ser 


arg 


met 


leu 


leu 


arg pro 


ala 


asp 


tyr 


gin 


arg 


ser 


leu 


ser 


61/21 


















91/31 
















ttc tac 


cgt 


gac 


cag 


ate 


ggg 


ctg 


gcg 


att 


gec cgt 


gaa 


tac 


ggg 


gee 


ggc 


aca 


gtg 


ttt 


phe tyr 


arg 


asp 


gin 


ile 


gly 


leu 


ala 


ile 


ala arg 


glu 


tyr 


gly 


ala 


gly 


thr 


val 


phe 


121/41 


















151/51 
















ttc gec 


ggt 


cag 


tea 


ctg 


etc 


gaa 


ctg 


gec 


ggt tac 


ggc 


gag 


ccg 


gac 


cat 


teg 


egg 


gga 


phe ala 


gly 


gin 


ser 


leu 


leu 


glu 


leu 


ala 


gly tyr 


gly 


glu 


pro 


asp 


his 


ser 


arg 


gl y 


181/61 


















211/71 














cct ttt 


CCC 


ggc 


gcg 


ctg 


tgg 


ctg 


cag 


gtg 


cgc gac 


etc 


gag 


get 


ace 


cag 


ace 


gag 


ctg 


pro phe 


pro 


gly 


ala 


leu 


trp 


leu 


gin 


val 


arg asp 


leu 


glu 


ala 


thr 


gin 


thr 


glu 


leu 


241/81 


















271/91 














gtc age 


cga 


ggc 


gtg 


teg 


ate 


get 


cgc 


gag 


ccc cgc 


cgc 


gaa 


ccg 


tgg 


ggc 


ctg 


cac 


gag 


val ser 


arg 


gly 


val 


ser 


ile 


ala 


arg 


glu 


pro arg 


arg 


glu 


pro 


trp 


gly 


leu 


his 


glu 


301/101 


















331/111 



















atg cat 


gtg 


acc 


gac 


cca 


gac 


ggg 


ate aca 


ctg 


ata 


tec 


gtc 


gag 


gt t 


ccc gag 


ggt cac 


rr.e t his 


val 


thr 


asp 


pro 


asp 


gly 


lie thr 


leu 


lie 


phe 


val 


glu 


val 


pro glu 


gly hi 3 


361/121 




























ccg ctg 


cgt 


aca 


gac 


acc 


egg 


gcg 


tga 


















pro leu 


arg 


thr 


asp 


thr 


arg 


ala 


OPA 



















SEQ ID N° 11D 



FEUILLE DE REMgto&©6KENiTE(REGLE 26) 



WO 99/09186 



PCT/FR98/018I3 



35/185 



ORF predite 


par 


par 


Cole et 


al. 


(Nature 


393: 537- 


-544 ) 


et 


contenant Rv0546c 




1/1 


















31/11 


















tag tea 
61/21 


ggg 

gly 


cgt 
arg 


gca 
ala 


ttc 
phe 


gac 
asp 


gac 
asp 


get 
ala 


gta 

... i 
val 


eta ccc 
leu pro 
91/31 


get 
ala 


ggt 
gly 


ggc 
gly 


aac 
asn 


tec 
ser 


gat 
asp 


gat 
asp 


tgc 
cys 


gcc gac 
ala asp 
121/41 


gaa 
gl u 


ggc 
gly 


eta 
leu 


cga 
a rg 


egg 
arg 


get 
ala 


gcc 
ala 


ggc 
gly 


get gac 
ala asp 
151/51 


cgc 
arg 


cgc 
arg 


gga 
gly 


age 
ser 


cgc 
arg 


cga 
arg 


gtg 
val 


gat 
asp 


ggt cac 
gly his 
181/61 


cgc 
arg 


cgc 
arg 


ccg 
pro 


cac 
his 


ccg 
pro 


acc 
thr 


ggt 
gly 


gcg 
ala 


gat cgc 
asp arg 
211/71 


gcc 
ala 


teg 
ser 


ggt 
gly 


tgc 
cys 


cgt 
arg 


cgc 
arg 


cgt 
arg 


caa 
gin 


cgc get 

a rn ala 
241/81 


gga 

y_Ly 


cag 
gin 


cat 
his 


egg 
a rg 


tec 
ser 


ccg 
pro 


ctg 
leu 


ggt 
gly 


caa tgc 
gin cys 
271/91 


act 
thr 


cat 
his 


gca 
ala 


gcg 
ala 


ccg 
pro 


caa 
gin 


cga 
arg 


aca 
thr 


get caa 
ala. nln 
301/101 


ccc 
pro 


ttg 

leu 


aac 
asn 


egg 


gtc 

Va 1 
Val 


ccg 
pro 


gcc 

did 


tgc 
cys 


cga ccc 
arg pro 
331/111 


teg 
ser 


gcc 
ala 


gcc 
ala 


ggc 
gly 


gtg 
val 


ccg 
pro 


eta 
leu 


cgt 
arg 


gat aga 
asp arg 
361/121 


cac 
his 


agg 
arg 


gcc 
ala 


atg 


gaa 
glu 


ate 
ile 


ctg 
leu 


gcc 

a,± a 


age egg 
ser arg 
391/131 


atg 
met 


eta 
leu 


ctt 
leu 


egg 
arg 


ccg 
pro 


gcg 
ala 


gac 
asp 


tat 
tyr 


cag egg 

rr 1 n a r rr 

421/141 


teg 
ser 


ctg 
leu 


age 
ser 


ttc 
phe 


tac 
tyr 


cgt 
arg 


gac 
asp 


cag 
gin 


ate ggg 
ile gly 
451/151 


ctg 
leu 


gcg 
ala 


att 
ile 


gcc 
ala 


cgt 
arg 


gaa 
glu 


tac 
tyr 


ggg 

gly 


acc acre 
ala gly 
481/161 


aca 
thr 


gtg 
val 


ttt 
phe 


ttc 
phe 


gcc 
ala 


ggt 
gly 


gin 


tea 
ser 


ctg etc 
leu leu 
511/171 


gaa 
glu 


ctg 
leu 


gcc 
ala 


ggt 
gly 


tac 
tyr 


ggc 
gly 


gag 
glu 


ccg 
pro 


gac cat 
asp his 
541/181 


teg 
ser 


egg 
arg 


gga 
gly 


cct 
pro 


ttt 
phe 


ccc 
pro 


ggc 
gly 


gcg 
ala 


ctg tgg 
leu trp 
571/191 


ctg 
leu 


cag 
gin 


gtg 
val 


cgc 
arg 


gac 
asp 


etc 
leu 


gag 
glu 


get 
ala 


acc cag 
thr gin 
601/201 


acc 
thr 


gag 
glu 


ctg 
leu 


gtc 
val 


age 
ser 


cga 
arg 


ggc 
gly 


gtg 
val 


teg ate 
ser ile 
631/211 


get 
ala 


cgc 
arg 


gag 
glu 


ccc 
pro 


cgc 
arg 


cgc 
arg 


gaa 
glu 


ccg 
pro 


tgg ggc 
trp gly 
661/221 


ctg 
leu 


cac 
his 


gag 
glu 


atg 
met 


cat 
his 


gtg 
val 


acc 
thr 


gac 
asp 


cca gac 
pro asp 
691/231 


ggg 

gly 


ate 
ile 


aca 
thr 


ctg 
leu 


ata 

ile 


ttc 
phe 


gtc 
val 


gag 
glu 


gtt ccc 
val pro 


gag 

glu 


ggt 
gly 


cac 
his 


ccg 
pro 


ctg 
leu 


cgt 
arg 


aca 

Lill 


gac 
asp 


acc egg 
thr arg 


gcg 
ala 


tga 
OPA 















SEQ ID N° 11F 
FIGURE 11F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



36/185 



1/1 


















31/11 


















gac cga 
asp arg 
61/21 


agg 
arg 


gat 
asp 


ttc 
phe 


gcg 
ala 


act 
thr 


aac 
asn 


teg 
ser 


gcc 
ala 


tgt aag 
cys lys 
91/31 


gca 
ala 


acg 
thr 


cga 
arg 


ggt 
gly 


ctt 
leu 


cat 
his 


gcc 
ala 


gag 
glu 


gac gta 
asp val 
121/41 


gac 
asp 


agg 
arg 


aag 
lys 


aga 
arg 


cag 
gin 


gga 
gly 


age 
ser 


tga 
OPA 


tga cgt 
OPA arg 
151/51 


cgc 
arg 


gta 
val 


ccg 
pro 


gac 
asp 


cqc 
arg 


cat 
his 


tct 
ser 


gtc 
val 


gag tct 
glu ser 
181/61 


ttc 
phe 


cga 
arg 


gtt 
val 


cag 
gin 


caa 
gin 


caa 
gin 


teg 
ser 


aca 
thr 


cag aag 
gin lys 
211/71 


egg 
arg 


gga 
gly 


cca 
pro 


gac 
asp 


egg 
arg 


gag 
glu 


gac 
asp 


gac 
asp 


gcg gcc 
ala ala 
241/81 


egg 
arg 


gcc 
ala 


get 
ala 


teg 
ser 


ggc 
gly 


cga 
arg 


gtg 
val 


tct 
ser 


gag taa 
glu OCH 
271/91 


gac 
asp 


cag 
gin 


agt 
ser 


cac 
his 


ggg 

gly 


tec 
ser 


gtg 
val 


tgt 
cys 


gac aac 
asp asn 
301/101 


eg c 
arg 


gcg 
ala 


gaa 
glu 


ttc 
phe 


aat 
asn 


egg 
arg 


atg 
met 


gcg 
ala 


ggc ggg 
gly gly 


acc 
thr 


gga 
gly 


ttg 
leu 


cgc 
arg 


egg 
arg 


tea 
ser 


ccg 
pro 


agg 
arg 


aac etc 


cqa 


agt 


gat 






























asn leu 


arg 


ser 


asp 












































SEQ ID 


N° 12A 






























FIGURE 12A 


















1/1 


















31/11 


















acc gaa 
thr glu 
61/21 


ggg 

gly 


att 
ile 


teg 
ser 


cga 
arg 


eta 
leu 


act 
thr 


egg 
arg 


cct 
pro 


gta agg 
val arg 
91/31 


caa 
gin 


cgc 
arg 


gag 
glu 


gtc 
val 


ttc 
phe 


atg 
met 


ccg 
pro 


agg 
arg 


acg tag 
thr AMB 
121/41 


aca 
thr 


gga 
gly 


aga 
arg 


gac 
asp 


agg 
arg 


gaa 
glu 


get 
ala 


gat 
asp 


gac gtc 
asp val 
151/51 


gcg 
ala 


tac 
ty r 


egg 
a rg 


acc 
thr 


gcc 
ala 


att 
ile 


ctg 
leu 


teg 
ser 


agt ctt 
ser leu 
181/61 


tec 
ser 


gag 
glu 


ttc, 
phe 


age 
ser 


aac 
asn 


aat 
asn 


cga 
arg 


cac 
his 


aga age 
arg ser 
211/71 


ggg 

gly 


gac 
asp 


cag 
gin 


acc 
thr 


ggg 

gly 


agg 
arg 


acg 
thr 


acg 
thr 


egg ccc 
arg pro 
241/81 


ggg 

gly 


ccg 
pro 


ctt 
leu 


egg 
arg 


gcc 
ala 


gag 
glu 


tgt 
cys 


ctg 
leu 


agt aag 
ser lys 
271/91 


acc 
thr 


aga 
arg 


gtc 
val 


acg 
thr 


ggt 
gly 


ccg 
pro 


tgt 
cys 


gtg 
val 


aca acc 
thr thr 
301/101 


gcg 
ala 


egg 
arg 


aat 
asn 


tea 
ser 


ate 
ile 


gga 
gly 


tgg 
t rp 


egg 
arg 


gcg gga 
ala gly 


ccg 
pro 


gat 
asp 


tgc 
cys 


gcc 
ala 


ggt 
gly 


cac 
his 


cga 
arg 


gga 
gly 



acc tec gga gtg ate 
thr ser gly val ile 

SEQ ID N° 12B 
FIGURE 12B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCIYFR98/01813 



1/1 



ccg aag 


gga 


ttt 


cgc 


gac 


pro lys 


gly 


phe 


arg 


asp 


61/21 










cgt aga 


cag 


gaa 


gag 


aca 


arg arg 


gin 


glu 


glu 


thr 


121/41 










gtc ttt 


ccg 


agt 


tea 


gca 


val phe 


pro 


ser 


ser 


ala 


181/ 61 










ggc ccg 


ggc 


cgc 


ttc 


ggg 


gly pro 


gly 


arg 


phe 


gly 


241/81 










caa ccg 


cgc 


gga 


att 


caa 


gin pro 


arg 


gly 


ile 


gin 


301/101 










cct ccg 


gag 


tga 


tc 




pro pro 


glu 


OPA 






1/1 










GGG ATT 


TCG 


TTG 


CCC 


GAT 


gly ile 


ser 


leu 


pro 


asp 


61/21 










TAT TGG 


CAA 


TGC 


TGG 


AAA 


tyr trp 


gin 


cy3 


trp 


lys 


121/41 










GGG GGG 


CAA 


GCG 


TTT 


GTA 


gly gly 


gin 


ala 


phe 


val 


181/61 










ATG TTG 


TTG 


TGT 


CAG 


CGC 


met leu 


leu 


CVS 


gin arg 


241/81 










TCA AAA 


CAG 


GTT 


GAA 


CTT 


ser lys 


gin 


val 


glu 


leu 


301/101 










GGA CAC 


CAA 


TTT 


GAC 


TCG 


gly his 


qln 


one 


asp 


3er 


361/121 










CGC ATC 


GTT 


GGC 


CTT 


GCC 


arg ile 


val 


gly 


leu 


ala 


421/141 










GGG ACC 


GAC 


CTC 


GAC 


CAG 


gly thr 


asp 


leu 


asp gin 


481/161 










GTC GGT 


CAT 


CGC 


CTA 


AGG 


val gly 


his 


arg 


leu 


arg 


541/181 










GGC ACG 


TCA 


TGT 


CTC 


AGC 


gly thr 


ser 


cys 


leu 


ser 


601/201 










CAG ATG 


ACT 


CCA 


CGC 


AGC 


gin met 


thr 


pro 


arg 


3er 


661/221 










CTG GTG 


AGC 


GCA 


CCC 


GCC 


leu val 


ser 


ala 


pro 


ala 



37/185 



31/11 

taa etc ggc ctg taa ggc aac 
OCH leu gly leu OCH gly asn 
91/31 

ggg aag ctg atg acg teg cgt 
gly lys leu met thr ser arg 
151/51 

aca ate gac aca gaa gcg ggg 
thr ile asp thr glu ala gly 
211/71 

ccg agt gtc tga gta aga cca 
pro ser val OPA val arg pro 
271/91 

teg gat ggc ggg egg gac egg 
ser asp gly gly arg asp arg 



SEQ ID N° 12 
FIGURE 12C 











31/11 




GGA 


TTG 


TTT 


GTA 


CGG TTT 


GGG 


gly 


leu 


phe 


val 


arg phe 


gly 










91/31 




TGG 


ACA 


TTC 


CAA 


TAT TGC 


GCG 


trp 


thr 


phe 


gin 


tyr cys 


ala 










151/51 




CCG 


GGG 


CCA 


GCA 


AGC GCC 


GCC 


pro 


gly pro 


ala 


ser ala 


ala 










211/71 




GGG 


CTT 


GGT 


CTC 


GAT GTC 


CCG 


gly 


leu 


gly 


leu 


asp val 


pro 










271/91 




AAC 


GAC 


TCA 


AGA 


ACG GAA 


ACG 


asn 


asp 


ser 


arg 


thr glu 


thr 










331/111 




GCT 


CTT 


TGG 


CAA 


TTG AAG 


GTG 


ala 


leu 


trp 


gin 


leu lys 


val 










391/131 




ATC 


AAT 


CGC 


CGG 


CTC GCG 


GAC 


ile 


asn 


arg 


arg 


leu ala 


asp 










451/151 




GGG 


TCC 


TTT 


GTG 


ACT GCC 


GGG 


gly 


ser 


phe 


val 


thr ala 


gly 










511/171 




CTA 


CCG 


TTC 


TGA 


CCT GGG 


GCT 


leu 


pro 


phe 


OPA 


pro gly 


ala 










571/191 




GGC 


CCA 


CCG 


CCA 


CCT CGG 


TCG 


gly 


pro 


pro 


pro 


pro arg 


ser 










631/211 




CTT 


GTT 


CGC 


ATC 


GTT GGT 


GTC 


leu 


val 


arg 


lie 


val gly 


val 










691/231 




GGC 


GGT 


CGT 


GCC 


GCG CAT 


GCG 


gly 


gly 


arg 


ala 


ala his 


ala 



SEQ ID N° 1 



gcg 
ala 


agg 
arg 


tct 
ser 


tea 
ser 


tgc 
cys 


cga 
arg 


gga 
gly 


acc 
thr 


gga 
gly 


cca 
pro 


cca 
pro 


ttc 
phe 


tat 

cys 


cga 
arg 


acc 
thr 


aga 
arg 


ccg 
pro 


gga 
gly 


gga 
gly 


cga 
arg 


cgc 
arg 


gag 
glu 


tea 
ser 


egg 
arg 


gtc 
val 


cgt 
arg 


gtg 
val 


tga 
OPA 


act 
ile 


gcg 
ala 


ccg 
pro 


gtc 
val 


acc 
thr 


gag 
glu 


gaa 
glu 


C 














AAA 
lys 


AAC 
asn 


ACT 
thr 


TGA 
OPA 


AGT 
ser 


CCT 
pro 


phe 


AAT 
asn 


TAA 

OCH 


CCG 
pro 


AAC 
asn 


ACG 
thr 


GTG 
val 


AGG 
arg 


GAC 
asp 


CGG 
arg 


TTG 
leu 


ACC 
thr 


GAA 
glu 


GCC 
ala 


AGC 
ser 


GCC 
ala 


TTG 
leu 


GCT 
ala 


GGA 
gly 


CCC 
pro 


GCT 
ala 


TCT 
ser 


CTT 

leu 


GAA 
glu 


CCG 
pro 


CGA 
arg 


CGT 
arg 


CGC 
arg 


TCC 
ser 


AGC 
ser 


TGC 
cys 


GAG 
glu 


CAG 
gin 


CCG 
pro 


GGT 
gly 


GAC 
asp 


GTA 
val 


GAT 


AAT 


CAG 
gin 


CTC 
leu 


ACC 
car 


GTT 
vai 


CTT 
leu 


GAC 
asp 


GCG 
ala 


GAC 
asp 


GAC 
asp 


CAC 
his 


AGA 
arg 


GCG 
ala 


TGG 
trp 


GCG 
ala 


CCG 
pro 


ACG 
thr 


ACG 
thr 


TGA 
OPA 


CCG 
pro 


GCA 
ala 


GTA 
val 


TGT 

cys 


CAG 
gin 


CAT 
his 


GTG 
val 


GTG 

val 


GTT 
val 


GCG 
ala 


ACG 
thr 


ACC 
thr 


TTG 
leu 


GCG 
ala 



GAT C 
asp 



FIGURE 13A 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



38/185 





















32/11 


















GGA TTT 


CGT 


TGC 


CCG 


ATG 


GAT 


TGT 


TTG 


TAC 


GGT TTG 


GGA 


AAA 


ACA 


CTT 


GAA 


GTC 


CTT 


TTT 


gly phe 


arg 


cys 


pro 


met 


asp 


cys 


leu 


tyr 


gly leu 


gly 


lys 


thr 


leu 


qlu 


val 


leu 


phe 


62/21 


















92/31 














ATT GGC 


AAT 


GCT 


GGA 


AAT 


GGA 


CAT 


TCC 


AAT 


ATT GCG 


CGA 


ATT 


AAC 


CGA 


ACA 


CGG 


TGA 


GGG 


ile gly 


asn 


ala 


gly 


asn 


gly 


his 


ser 


asn 


ile ala 


arg 


ile 


asn 


arg 


thr 


arq 


OPA 


crl v 


122/41 


















152/51 














GGG GGC 


AAG 


CGT 


TTG 


TAC 


CGG 


GGC 


CAG 


CAA 


GCG CCG 


CCG 


ACC 


GGT 


TGA 


CCG 


AAG 


CCA 


GCA 


gly gly 


lys 


arg 


leu 


tyr 


arg 


gly 


gin 


gin 


ala pro 


pro 


thr 


gly 


OPA 


pro 


1 vs 


Pro 


ala 


182/61 


















212/71 










TGT TGT 


TGT 


GTC 


AGC 


GCG 


GGC 


TTG 


GTC 


TCG 


ATG TCC 


CGG 


CCT 


TGG 


CTG 


GAC 


CCG 


CTT 


CTT 


cys cys 


cys 


val 


ser 


ala 


giy 


leu 


val 


ser 


met ser 


arg 


pro 


trp 


leu 


asp 


pro 


leu 


leu 


242/81 


















272/91 














CAA AAC 


AGG 


TTG 


AAC 


TTA 


ACG 


ACT 


CAA 


GAA 


CGG AAA 


CGC 


TTG 


AAC 


CGC 


GAC 


GTC 


GCT 


CCG 


gin asn 


arg 


leu 


asn 


leu 


thr 


thr 


gin 


glu 


arg lys 


arg 


leu 


asn 


arq 


asp 


val 


ala 


pro 


302/101 


















332/111 












GAC ACC 


AAT 


TTG 


ACT 


CGG 


CTC 


TTT 


GGC 


AAT 


TGA AGG 


TGA 


GCT 


GCG 


AGC 


AGC 


CGG 


GTG 


ACC 


asp thr 


asn 


leu 


thr 


arg 


leu 


phe 


gly 


asn 


OPA arg 


OPA 


ala 


ala 


ser 


ser 


arg 


va 1 


thr 


362/121 


















392/131 
















GCA TCG 


TTG 


GCC 


TTG 


CCA 


TCA 


ATC 


GCC 


GGC 


TCG CGG 


ACG 


TAG 


ATA 


ATC 


AGC 


TCA 


CCG 


TTG 


ala ser 


leu 


ala 


leu 


pro 


ser 


ile 


ala 


gly 


ser arg 


thr 


AM 3 


ile 


ile 


ser 


ser 


pro 


leu 


422/141 


















452/151 
















GGA CCG 


ACC 


TCG 


ACC 


AGG 


GGT 


CCT 


TTG 


TGA 


CTG CCG 


GGC 


TTG 


ACG 


CGG 


ACG 


ACC 


ACA 


GAG 


gly pro 


thr 


ser 


thr 


arg 


gly 


pro 


leu 


OPA 


leu pro 


gly 


leu 


thr 


arg 


thr 


thr 


thr 


glu 


482/161 


















512/171 
















TCG GTC 


ATC 


GCC 


TAA 


GGC 


TAC 


CGT 


TCT 


GAC 


CTG GGG 


CTG 


CGT 


GGG 


CGC 


CGA 


CGA 


CGT 


GAG 


ser val 


ile 


ala 


OCH 


gly 


tyr 


arg 


ser 


asp 


leu gly 


leu 


arg 


gly 


arg 


arg 


arg 


arg 


glu 


542/181 


















572/191 










GCA CGT 


CAT 


GTC 


TCA 


GCG 


GCC 


CAC 


CGC 


CAC 


CTC GGT 


CGC 


CGG 


CAG 


TAT 


GTC 


AGC 


ATG 


TGC 


ala arg 


his 


val 


ser 


ala 


ala 


his 


arg 


his 


leu gly 


arg 


arg 


gin 


tyr 


val 


ser 


met 


cys 


602/201 


















632/211 














AGA TGA 


CTC 


CAC 


GCA 


GCC 


TTG 


TTC 


GCA 


TCG 


TTG GTG 


TCG 


TGG 


TTG 


CGA 


CGA 


CCT 


TGG 


CGC 


arg OPA 


leu 


his 


ala 


ala 


leu 


phe 


ala 


ser 


leu val 


ser 


trp 


leu 


arg 


arg 


pro 


trp 


arg 


662/221 


















692/231 










TGG TGA 


GCG 


CAC 


CCG 


CCG 


GCG 


GTC 


GTG 


CCG 


CGC ATG 


CGG 


ATC 














trp OPA 


ala 


his 


pro 


pro 


ala 


val 


val 


pro 


arg met 


arg 


ile 















SEQ ID N° 13B 
FIGURE 13B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



39/185 



33/11 



GAT TTC 


GTT 


GCC 


CGA 


TGG 


ATT 


GTT 


TGT 


ACG 


GTT TGG 


GAA 


AAA 


CAC 


TTG 


AAG 


TCC 


TTT 
ill 


TTA 


asp phe 


val 


ala 


arg 


trp 


ile 


val 


cvs 


thr 


val trp 


glu 




his 


leu 


lys 


ser 


phe 


leu 


63/21 


















93/31 














TTG GCA 


ATG 


CTG 


GAA 


ATG 


GAC 


ATT 


CCA 


ATA 


TTG CGC 


GAA 


TTA 


ACC 


GAA 


CAC 


GGT 


GAG 


GGG 


leu ala 


met 


leu 


glu 


met 


asp 


ile 


pro 


ile 


leu arg 


glu 


leu 


thr 


glu 


Ills 


gly 


glu 


gly 


123/41 


















153/51 












GGG GCA 


AGC 


GTT 


TGT 


ACC 


GGG 


GCC 


AGC 


AAG 


CGC CGC 


CGA 


CCG 


GTT 


GAC 


CGA 


AGC 


CAG 


CAT 


gly ala 


ser 


val 


cys 


thr 


gly 


ala 


ser 


lys 


arq ara 


a rg 


pro 


val 


asp 


arg 




gin 


hie 


183/61 


















213/71 












GTT GTT 


GTG 


TCA 


GCG 


CGG 


GCT 


TGG 


TCT 


CGA 


TGT CCC 


GGC 


CTT 


GGC 


TGG 


ACC 


CGC 


TTC 


TTC 


val val 


val 


ser 


ala 


arg 


ala 


trp 


ser 


arg 


cys pro 


al v 


leu 


y x y 


t rn 


thr 


arg 


phe 


phe 


243/81 


















273/91 












AAA ACA 


GGT 


TGA 


ACT 


TAA 


CGA 


CTC 


AAG 


AAC 


GGA AAC 


GCT 


TGA 


ACC 


GCG 


ACG 


TCG 


CTC 


CGG 


lys thr 


giy 


OPA 


thr 


OCH 


arg 


leu 


lys 


asn 


gly asn 


ala 


OPA 


thr 


ala 


thr 






a r g 


303/101 


















333/111 
















ACA CCA 


ATT 


TGA 


CTC 


GGC 


TCT 


TTG 


GCA 


ATT 


GAA GGT 


GAG 


CTG 


CGA 


GCA 


GCC 


GGG 


TGA 


CCG 


thr pro 


ile 


OPA 


leu 


gly 


ser 


leu 


ala 


ile 


glu gly 


qlu 


leu 


arg 


ala 


ala 


y ly 


OPA 


pro 


363/121 


















393/131 














CAT CGT 


TGG 


CCT 


TGC 


CAT 


CAA 


TCG 


CCG 


GCT 


CGC GGA 


CGT 


AGA 


TAA 


TCA 


GCT 


CAC 


CGT 


TGG 


his arg 


trp 


pro 


cys 


his 


gin 


ser 


pro 


ala 


arg gly 


arc 


ara 


OCH 


ser 


ala 


his 


arg 


urp 


423/141 


















453/151 














GAC CGA 


CCT 


CGA 


CCA 


GGG 


GTC 


CTT 


TGT 


GAC 


TGC CGG 


GCT 


TGA 


CGC 


GGA 


CGA 


CCA 


CAG 


AGT 


asp arg 


pro 


arg 


pro 


gly 


val 


leu 


cys 


asp 


cys arg 


ala 


OPA 


arg 


gly 


arg 


pro 


gin 


ser 


483/161 


















513/171 










CGG TCA 


TCG 


CCT 


AAG 


GCT 


ACC 


GTT 


CTG 


ACC 


TGG GGC 


TGC 


GTG 


GGC 


GCC 


GAC 


GAC 


GTG 


AGG 


arg ser 


ser 


pro 


lys 


ala 


thr 


val 


leu 


thr 


trp gly 


cys 


val 


gly 


ala 


asp 


asp 


val 


arg 


543/181 


















573/191 










CAC GTC 


ATG 


TCT 


CAG 


CGG 


CCC 


ACC 


GCC 


ACC 


TCG GTC 


GCC 


GGC 


AGT 


ATG 


TCA 


GCA 


TGT 


GCA 


his val 


met 


ser 


gin 


arg 


pro 


thr 


ala 


thr 


ser val 


ala 


gly 


ser 


met 


ser 


ala 


cys 


ala 


603/201 


















633/211 














GAT GAC 


TCC 


-ACG 


CAG 


CCT 


TGT 


TCG 


CAT 


CGT 


TGG TGT 


CGT 


GGT 


TGC 


GAC 


GAC 


CTT 


GGC 


GCT 


asp asp 


ser 


thr 


gin 


pro 


cys 


ser 


his 


arg 


trp cys 


arg 


gly 


cys 


asp 


asp 


leu 


gly 


ala 


663/221 


















693/231 












GGT GAG 


CGC 


ACC 


CGC 


CGG 


CGG 


TCG 


TGC 


CGC 


GCA TGC 


GGA 


TC 














gly glu 


arg 


thr 


arg 


arg 


arg 


ser 


cys 


arg 


ala cys 


gly 

















SEQ ID N° 13C 
FIGURE 13C 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



40/185 



partie de la sequence nucleotidique de : 
1/1 

GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG 

gly ser phe val thr ala gly leu asp ala 
61/21 

CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG 

leu pro phe OPA pro gly ala ala trp ala 
121/41 

GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA 

gly pro pro pro pro arg ser pro ala val 
181/61 

CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG 

leu val arg ile val gly val val val ala 
241/81 

GGC GGT CGT GCC GCG CAT GCG GAT C 

gly gly arg ala ala his ala asp 



eql3A 
31/11 



GAC GAC 


CAC 


AGA 


GTC 


GGT 


CAT 


CGC 


CTA 


AGG 


asp asp 


hi s 


arg 


val 


gly his 


arg 


leu 


arg 


91/31 
















CCG ACG 


ACG 


TGA 


GGC 


ACG 


TCA 


TGT 


CTC 


AGC 


pro thr 


thr 


OPA 


gly 


thr 


ser 


cys 


leu 


ser 


151/51 
















TGT CAG 


CAT 


GTG 


CAG 


ATG 


ACT 


CCA 


CGC 


AGC 


cys gin 


his 


val 


gin 


met 


thr 


pro 


arg 


ser 


211/71 
















ACG ACC 


TTG 


GCG 


CTG 


GTG 


AGC 


GCA 


ccc 


GCC 


thr thr 


leu 


ala 


leu 


val 


ser 


ala 


pro 


ala 



SEQ ID N° 13A' 



FIGURE 13A' 



1/1 

GGT CCT TTG TGA CTG 

gly pro leu OPA leu 
61/21 

TAC CGT TCT GAC CTG 

tyr arg ser asp leu 
121/41 

GCC CAC CGC CAC CTC 

ala his arg his leu 
181/61 

TTG TTC GCA TCG TTG 

leu phe ala ser leu 
241/81 

GCG GTC GTG CCG CGC 

ala val val pro arg 



CCG 


GGC 


TTG ACG 


CGG 


pro 


gly 


leu thr 


arg 


GGG 


CTG 


CGT GGG 


CGC 


gly 


leu 


arg gly 


arg 


GGT 


CGC 


CGG CAG 


TAT 


gly 


arg arg gin 


tyr 


GTG 


TCG 


TGG TTG 


CGA 


val 


ser 


trp leu 


arg 


ATG 


CGG 


ATC 




met 


arg 


ile 





31/11 

ACG ACC AC A GAG TCG 
thr thr thr glu ser 
91/31 

CGA CGA CGT GAG GCA 
arg arg arg glu ala 
151/51 

GTC AGC ATG TGC AGA 
val ser met cys arg 
211/71 

CGA CCT TGG CGC TGG 
arg pro trp arg trp 



GTC ATC GCC TAA GGC 
val ile ala OCH gly 

CGT CAT GTC TCA GCG 
arg hi3 val ser ala 

TGA CTC CAC GCA GCC 
OPA leu his ala ala 

TGA GCG CAC CCG CCG 
OPA ala his pro pro 



SEQ ID N° 13B' 



FIGURE 13B' 



1/1 

GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA 

val leu cys asp cys arg ala OPA arg gly 
61/21 

ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC 

thr val leu thr trp gly cys val gly ala 
121/41 

CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG 

pro thr ala thr ser val ala gly ser met 
131/61 

TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC 

cys ser his arg trp cys arg gly cys asp 
241/81 

CGG TCG TGC CGC GCA TGC GGA TC 

arg ser cys arg ala cys gly 



31/11 

CGA CCA CAG AGT CGG TCA TCG CCT AAG GCT 
arg pro gin ser arg ser ser pro lys ala 
91/31 

GAC GAC GTG AGG CAC GTC ATG TCT CAG CGG 
asp asp val arg his val met ser gin arg 
151/51 

TCA GCA TGT GCA GAT GAC TCC ACG CAG CCT 
ser ala cys ala asp asp ser thr gin pro 
211/71 

GAC CTT GGC GCT GGT GAG CGC ACC CGC CGG 
asp leu gly ala gly glu arg thr arg arg 



SEQ ID N° 13C 
FIGURE 13C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



41/185 



sequence Rvl984c predite par Cole et 

seql3A' 

1/1 

atg act cca cgc age ctt gtt cgc ate gtt 
Met thr pro arg ser leu val arg ile val 
61/21 

gtg age gca ccc gee ggc ggt cgt gee gcg 
val ser ala pro ala gly gly arg ala ala 
121/41 

gtt ttc get cgc ggc acg cat cag get tct 
val phe ala arg gly thr his gin ala ser 
181/61 

gac teg ctt acc teg caa gtt ggc ggg egg 
asp ser leu thr ser gin val gly gly arg 
241/81 

gca age gac gac tac cgc gcg age gcg tea 
ala ser asp asp tyr arg ala ser ala ser 
301/101 

cag cgc acc gtc gee age tgc ccg aac acc 
gin arg thr val ala ser cys pro asn thr 
361/121 

gcg acg gtc ate gat ttg tec acc teg gcg 
ala thr val ile asp leu ser thr ser ala 
421/141 

get gtc gee ctt ttc ggc gag cca tec agt 
ala val ala leu phe gly glu pro ser ser 
481/161 

teg ttg ccg aca ate ggt ccg ctg tat age 
ser leu pro thr ile gly pro leu tyr ser 
541/181 

gat cca ata tgc acc gga ggc ggc aat att 
asp pro ile cys thr gly gly gly asn ile 
601/201 

atg aca age cag gcg gcg aca ttc gcg gcg 
met thr ser gin ala ala thr phe ala ala 



al. (Nature 393:537-544) et contenant 
31/11 

ggt gtc gtg gtt gcg acg acc ttg gcg ctg 
gly val val val ala thr thr leu ala leu 
91/31 

cat gcg gat ccg tgt teg gac ate gcg gtc 
his ala asp pro cys ser asp ile ala val 
151/51 

ggt ctt ggc gac gtc ggt gag gcg ttc gtc 
gly leu gly asp val gly glu ala phe val 
211/71 

teg att ggg gtc tac gcg gtg aac tac cca 
ser ile gly val tyr ala val asn tyr pro 
271/91 

aac ggt tec gat gat gcg age gee cac ate 
asn gly ser asp asp ala ser ala his ile 
331/111 

agg att gtg ctt ggt ggc tat teg cag ggt 
arg ile val leu gly gly tyr ser gin gly 
391/131 

atg ccg ccc gcg gtg gca gat cat gtc gee 
met pro pro ala val ala asp his val ala 
451/151 

ggt ttc tec age atg ttg tgg ggc ggc ggg 
gly phe ser ser met leu trp gly gly gly 
511/171 

tct aag acc ata aac ttg tgt get ccc gac 
ser lys thr ile asn leu cys ala pro asp 
571/191 

atg gcg cat gtt teg tat gtt cag teg ggg 
met ala his val ser tyr val gin ser gly 
631/211 

aac agg etc gat cac gec gga tga 
asn arg leu asp his ala gly OPA 



SEQ ID N° 13D 
FIGURE 13D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



42/185 



Seql3F: 


ORF 


predite 


par 


Cole et 


al. 


(Nature 393 


:537- 


-544) 


et 


contenant Rvl984c 


1/1 


















31/11 


















tga ggc 
OPA gly 
61/21 


acg 
thr 


tea 
ser 


tgt 
cys 


etc 
leu 


age 
ser 


ggc 
gly 


cca 
pro 


ccg 
pro 


cca cct 
pro pro 
91/31 


egg 
arg 


teg 
ser 


ccg 
pro 


gca 
ala 


gta 
val 


tgt 
cys 


cag 
gin 


cat 
his 


gtg cag 
val gin 
121/41 


atg 
met 


act 
tnr 


cca 
pro 


cgc 
arg 


age 
ser 


ctt 
leu 


gtt 
val 


cgc 
arg 


ate gtt 
ile val 
151/51 


ggt 
gly 


gtc 
val 


gtg 
val 


gtt 
val 


gcg 
ala 


acg 
thr 


acc 
thr 


ttg 
leu 


gcg ctg 
ala leu 
181/61 


gtg 
val 


age 
ser 


gca 
ala 


ccc 
pro 


gee 
ala 


ggc 
gly 


ggt 
gly 


cgt 
arg 


gee gcg 
ala ala 
211/71 


cat 
his 


gcg 
ala 


gat 
asp 


ccg 
pro 


tgt 
cys 


teg 
ser 


gac 
asp 


ate 
ile 


gcg gtc 
ala val 
241/81 


gtt 
val 


ttc 
phe 


get 

did 


cgc 
arg 


ggc 
gly 


acg 
tnr 


cat 
his 


cag 
gin 


get tct 
ala ser 
271/91 


ggt 
gly 


ctt 
leu 


ggc 
gly 


gac 
asp 


gtc 
val 


ggt 
gly 


gag 
glu 


gcg 
ala 


ttc gtc 
phe val 
301/101 


gac 
asp 


teg 
ser 


Ctt 

leu 


acc 
thr 


teg 
ser 


caa 
gin 


gtt 
val 


ggc 
gly 


ggg egg 
gly arg 
331/111 


teg 
ser 


att 
ile 


ggg 

gly 


gtc 
val 


tac 
tyr 


gcg 
ala 


gtg 
val 


aac 
asn 


tac cca 
tyr pro 
361/121 


gca 
ala 


age 
ser 


gac 
asp 


gac 
asp 


tac 
tyr 


cgc 
arg 


gcg 
ala 


age 
ser 


gcg tea 
ala ser 
391/131 


aac 
asn 


ggt 
gly 


tec 
ser 


gat 
asp 


gat 
asp 


gcg 
ala 


age 
ser 


gec 
ala 


cac ate 
his ile 
421/141 


cag 
gin 


cgc 
a rg 


acc 
tnr 


gtc 
val 


gec 
ala 


age 
ser 


tgc 
cys 


ccg 
pro 


aac acc 
asn thr 
451/151 


agg 
arg 


att 
ile 


gtg 
val 


ctt 
leu 


ggt 
gly 


ggc 
gly 


tat 
tyr 


teg 
ser 


cag ggt 
gin gly 
481/161 


gcg 
ala 


acg 
thr 


gtc 
val 


ate 
ile 


qat 
asp 


ttq 
leu 


tec 
ser 


acc 
thr 


tea acci 
ser ala 
511/171 


atg 
met 


ccg 
pro 


ccc 
pro 


gcg 
ala 


gtg 
val 


gca 
ala 


gat 
asp 


cat 

his 


gtc gec 
val ala 
541/181 


get 
ala 


gtc 
val 


gee 
ala 


ctt 
leu 


ttc 
phe 


ggc 
gly 


gag 
glu 


cca 
pro 


tec agt 
ser ser 
571/191 


ggt ttc 
gly phe 


tec 
ser 


age 
ser 


atg 
met 


ttg 
leu 


tgg 
trp 


ggc 
gly 


ggc ggg 
gly gly 
601/201 


teg 
ser 


ttg 
•leu 


ccg 
pro 


aca 
thr 


ate 
ile 


ggt 
gly 


ccg 
pro 


ctg 
leu 


tat age 
tyr ser 
631/211 


tct 
ser 


aag 
lys 


acc 
thr 


ata 
ile 


aac 
asn 


ttg 
leu 


tgt 
cys 


get 
ala 


ccc gac 
pro asp 
661/221 


gat 
asp 


cca 
pro 


ata 
ile 


tgc 

cys 


acc 
thr 


gga 
gly 


ggc 
gly 


ggc 
gly 


aat att 
asn ile 
691/231 


atg 
met 


gcg 
ala 


cat 
his 


gtt 
val 


teg 
ser 


tat 
tyr 


gtt 
val 


cag 
gin 


teg ggg 
ser gly 


atg 
met 


aca 
thr 


age 
ser 


cag 
gin 


gcg 
ala 


gcg 
ala 


aca 
thr 


ttc 
phe 


gcg gcg 
ala ala 


aac 
asn 


agg 
arg 


etc 
leu 


gat 
asp 


cac 
his 


gec 
ala 


gga 
gly 


tga 
OPA 



SEQ ID N° 13F 
FIGURE 13F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



43/185 



31/11 



CCA CCG 


GGG 


CTG 


GAG 


GGG 


CGA 


ATG 


TGC 


GCC 


GAA CGC 


CGT 


CGG 


CCA 


ACT 


TGG 


CCG 


CTG 


AGG 


pro pro 


gly 


leu 


glu 


gly 


arg 


met 


cys 


ala 


glu arg 


arg 


arg 


pro 


thr 


trp 


pro 


leu 


arg 


61/21 


















91/31 












GCG GCT 


GAT 


CCC 


CTG 


GCC 


CGA 


GAC 


GGG 


GCA 


AGC CAA 


TAG 


CGG 


CTC 


CAT 


CGG 


GCT 


TTG 


CTG 


ala ala 


asp 


pro 


leu 


ala 


arg 


asp 


gly 


ala 


ser gin AMB 


arg 


leu 


his 


arg 


ala 


leu 


leu 


121/41 


















151/51 












GTA GCG 


GTT 


CGG 


CGG 


GAA 


CCG 


AGC 


GCC 


GAC 


GTT GTC 


GGT 


GCC 


CGG 


TGA 


TAT 


ATT 


GGG 


TCA 


val ala 


val 


arg 


arg 


glu 


pro 


ser 


ala 


asp 


val val 


gly 


ala 


arg 


OPA 


tyr 


ile 


gly 


ser 


181/61 


















211/71 














GAC GGG 


TAT 


GGC 


GGC 


GAC 


TGA 


GGT 


GAT 


CTG 


CGA CAC 


GCC 


GCC 


GCG 


GTG 


CTC 


GAG 


CCA 


GGC 


asp gly 


tyr 


gly 


gly 


asp 


OPA 


gly 


asp 


leu 


arg his 


ala 


ala 


ala 


val 


leu 


qlu 

■y j. u 


oro 


crl v 


241/81 


















271/91 












TTA CGA 


CCA 


GGG 


AAT 


TTC 


GAA 


AAT 


GTT 


ATT 


CAG AAC 


ATC 


TTG 


TAT 


CTC 


TTC 


CTC 


CGT 


GCC 


leu arg 


pro 


gly 


asn 


phe 


glu 


asn 


val 


ile 


gin asn 


ile 


leu 


tyr 


leu 


phe 


leu 


arg 


ala 


301/101 


















331/111 












ACC CCC 


TAG 


GTG 


TAG 


TGT 


TTT 


CGA 


GTA 


CCG 


GCA GAT 


CCC 


AGT 


TCA 


CCA 


GTC 


TCA 


CCA 


GAT 


thr pro 

C 


AMB 


val 


AMB 


cys 


phe 


arg 


val 


pro 


ala asp 


pro 


ser 




p ro 


vai 


ser 


pro 


asp 
















SEQ ID 


N° 14A 






























FIGURE 14A 




































32/11 


















CAC CGG 


GGC 


TGG 


AGG 


GGC 


GAA 


TGT 


GCG 


CCG 


AAC GCC 


GTC 


GGC 


CAA 


CTT 


GGC 


CGC 


TGA 


GGG 


his arg 


gly 


trp 


arg 


gly 


glu 


cys 


ala 


pro 


asn ala 


val 


gly 


gin 


leu 


gly 


arg 


OPA qly 


62/21 


















92/31 














CGG CTG 


ATC 


CCC 


TGG 


CCC 


GAG 


ACG 


GGG 


CAA 


GCC AAT 


AGC 


GGC 


TCC 


ATC 


GGG 


CTT 


TGC 


TGG 


arg leu 


ile 


pro 


trp 


pro 


glu 


thr 


gly 


gin 


ala asn 


ser 


gly 


ser 


ile 


gly 


leu 


cys 


trp 


J. C. / 1 1 


















152/51 












TAG CGG 


TTC 


GGC 


GGG 


AAC 


CGA 


GCG 


CCG 


ACG 


TTG TCG 


GTG 


CCC 


GGT 


GAT 


ATA 


TTG 


GGT 


CAG 


AMB arg 


phe 


gly 


gly 


asn 


arg 


ala 


pro 


thr 


leu ser 


val 


pro 


gly 


asp 


ile 


leu 


gly 


gin 


182/61 


















212/71 












ACG GGT 


ATG 


GCG 


GCG 


ACT 


GAG 


GTG 


ATC 


TGC 


GAC ACG 


CCG 


CCG 


CGG 


TGC 


TCG 


AGC 


CAG 


GCT 


thr gly 


met 


ala 


ala 


thr 


glu 


val 


ile 


cys 


asp thr 


pro 


pro 


arg 


cys 


ser 


ser 


gin 


ala 


242/81 


















272/91 












TAC GAC 


CAG 


GGA 


ATT 


TCG 


AAA 


ATG 


TTA 


TTC 


AGA ACA 


TCT 


TGT 


ATC 


TCT 


TCC 


TCC 


GTG 


CCA 


tyr asp 


gin 


gly 


ile 


ser 


lys 


met 


leu 


phe 


arg thr 


ser 


cys 


ile 


ser 


ser 


ser 


val 


pro 


302/101 


















332/111 
















CCC CCT 


AGG 


TGT 


AGT 


GTT 


TTC 


GAG 


TAC 


CGG 


CAG ATC 


CCA 


GTT 


CAC 


CAG 


TCT 


CAC 


CAG 


ATC 


pro pro 


arg 


cys 


ser 


val 


phe 


glu 


tyr 


arg 


gin ile 


pro 


val 


his 


gin 


ser 


his 


gin 


ile 



SEQ ID N° 14B 
FIGURE 14B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



44/185 



ACC GGG 


GCT 


GGA 


GGG 


GCG 


thr gly 


ala 


gly 


gly 


ala 


63/21 










GGC TGA 


TCC 


CCT 


GGC 


CCG 


gly OPA 


ser 


pro 


gly 


pro 


123/41 










AGC GGT 


TCG 


GCG 


GGA 


ACC 


ser gly 


ser 


ala 


gly 


thr 


183/61 










CGG GTA 


TGG 


CGG 


CGA 


CTG 


arg val 


trp 


arg 


arg 


leu 


243/81 










ACG ACC 


AGG 


GAA 


TTT 


CGA 


thr thr 


arg 


glu 


phe 


arg 


303/101 










CCC CTA 


GGT 


GTA 


GTG 


TTT 


pro leu 


gly 


val 


val 


phe 











33/11 




AAT 


GTG 


CGC 


CGA 


ACG CCG 


TCG 


asn 


val 


arg 


arq 


thr pro 


ser 










93/31 




AGA 


CGG 


GGC 


AAG 


CCA ATA 


GCG 


arg 


arg 


crl v 


1 vs 


p ro i le 


ala 










153/51 




GAG 


CGC 


CGA 


CGT 


TGT CGG 


TGC 


glu 


arg 


arg 


arg 


cys arg 


cys 










213/71 




AGG 


TGA 


TCT 


GCG 


ACA CGC 


CGC 


arg 


OPA 


ser 


ala 


thr arg 


arg 










273/91 




AAA 


TGT 


TAT 


TCA 


GAA CAT 


CTT 


lys 


cys 


tyr 


ser 


glu his 


leu 










333/111 




TCG 


AGT 


ACC 


GGC 


AGA TCC 


CAG 


ser 


ser 


thr 


gly 


arg ser 


gin 



GCC AAC TTG GCC GCT GAG GGC 
ala asn leu ala ala glu gly 

GCT CCA TCG GGC TTT GCT GGT 
ala pro ser gly phe ala gly 

CCG GTG ATA TAT TGG GTC AGA 
pro val ile tyr trp val arg 

CGC GGT GCT CGA GCC AGG CTT 
arg gly ala arg ala arg leu 

GTA TCT CTT CCT CCG TGC CAC 
val ser leu pro pro cys his 

TTC ACC AGT CTC ACC AGA TC 
phe thr ser leu thr arg 



SEQ ID N° 14C 



FIGURE 14C 



partie de la sequence nucleotidique de seq!4A 
1/1 31/11 

TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA GAT C 

phe ser ser thr gly arg ser gin val his gin val ser pro asp 



SEQ ID N° 14A' 
FIGURE 14A' 



1/1 31/11 

TGT TTT CGA GTA CCG GCA GAT CCC AGG TTC ACC AGG TCT CAC CAG ATC 
cys phe arg val pro ala asp pro arg phe thr arg ser his gin ile 

SEQ ID N° 14C 
FIGURE 14C 



1/1 31/11 

GTT TTC GAG TAG CGG CAG ATC CCA GGT TCA CCA GGT CTC ACC AGA TC 
val phe glu tyr arg gin ile pro gly ser pro gly ieu thr arg 



SEQ ID N° 14C 



FIGURE 14C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



45/185 



ORF predite d'apres la sequence publiee par Cole et al . (Nature 393:537-544) et 
contenant seql4A* 

1/1 31/11 

TAG CGG TTC GGC GGG AAG CTA GCG GCG ACG TTG TCG GTG GCC GGT GAT ATA TTG GGT CAG 

AMB arg phe gly gly lys leu ala ala thr leu ser val ala gly asp ile leu gly qln 
61/21 91/31 

ACG GGT ATG GCG GCG GCT GAG GTG ATC TGC GAC ACG CCG CCG CGG TGC TCG AGC CAG GCT 

thr gly met ala ala ala glu val ile cys asp thr pro pro arg cys ser ser qln ala 
121/41 151/51 

TAC GAC CAG GGA ATT TCG AAA ATG TTA TTC AGA ACA TCT TGT ATC TCT TCT CCG TGC CAC 

tyr asp gin gly ile ser lys met leu phe arg thr ser cys ile ser ser pro cys his 
181/61 211/71 

CCC CTA GGT GTA GTG TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA gat 

pro leu gly val val phe ser ser thr gly arg ser gin val his gin val ser pro asp 
241/81 271/91 

cca egg ggc gcg atg aac ttc ccg gca teg gca teg cca ggt cga egg acg tgg teg cgc 

pro arg gly ala met asn phe pro ala ser ala ser pro gly arg arg thr trp ser arq 
301/101 331/111 

tat gac ggg aat ctg gag cct tgt egg gee get caa cat ate gaa gat gca eta ctt gag 

tyr asp gly asn leu glu pro cys arg ala ala gin his ile glu asp ala leu leu qlu 
361/121 391/131 

teg ttg cca gat cct gtc aga ttc ccg att tec gca aag gag egg tac gee cat gac cgt 

ser leu pro asp pro val arg phe pro ile ser ala lys glu arg tyr ala his asp are 
421/141 

gac cgt tta cac taa 
asp arg leu his OCH 



SEQ ID N° 14F 
FIGURE 14F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



46/185 



Sequence Rv3054c predite par Cole et 1. (Nature 393:537-544) 
pouvant etre en phase avec Seql4A' 



1/1 


















31/11 


















gtg tea 
vai ser 
61/21 


gat 
asp 


acc 
thr 


aag 
lys 


tec 
ser 


gac 
asp 


ate 
ile 


aaa 
lys 


ate 
ile 


ttg gcc 
leu ala 
91/31 


tta 
leu 


gtg 
vai 


gga 
gly 


age 
ser 


ctg 
leu 


cgc 
arg 


gcg 
ala 


gcg 
ala 


teg ttc 
ser phe 
121/41 


aac 
asn 


cgc 
arg 


cag 
gin 


ate 
ile 


gcc 
ala 


gag 
glu 


ctg 
leu 


get 
ala 


gcc aag 
ala lys 
151/51 


gtc 
vai 


get 
ala 


ccg 
pro 


gac 
asp 


ggc 
gly 


gtc 
vai 


acc 
thr 


gtc 
vai 


acc atg 
thr met 
181/61 


ttc 
phe 


gag 
glu 


ggg 

gly 


ctg 
leu 


ggg 

gly 


gac 
asp 


ctg 
leu 


ccg 
pro 


ttc tac 
phe tyr 
211/71 


aac 
asn 


gaa 
glu 


gac 
asp 


ate 
ile 


gac 
asp 


aca 
thr 


gcg 
ala 


acg 
thr 


gag gtg 
glu vai 
241/81 


ccg 
pro 


gcg 
ala 


ccg 
pro 


gtg 
vai 


age 
ser 


gcg 
ala 


ttg 

leu 


egg 
arg 


gag gcc 
glu ala 

tti / Q 1 


gcg 
ala 


tct 
ser 


gac 
asp 


gcg 
ala 


cac 
his 


get 
ala 


gcc 
ala 


ttg 
leu 


gtg gtc 
vai vai 
301/101 


acg 
thr 


ccg 
pro 


gaa 
glu 


tac 
tyr 


aac 
asn 


ggc 
gly 


age 
ser 


att 

ile 


ccg gcc 
pro ala 
331/111 


gtg 
vai 


ate 
ile 


aag 
lys 


aac 
asn 


gcg 
ala 


ate 
ile 


gac 
asp 


tgg 
trp 


ctg tec 
leu ser 
361/121 


agg 
arg 


cca 
pro 


ttc 
phe 


ggc 
gly 


gat 
asp 


ggc 
gly 


gcg 
ala 


ttg 
leu 


aag gac 
lys asp 
391/131 


aag 
lys 


ccg 
pro 


ttg 
leu 


gcc 
ala 


gtg 
vai 


ate 
ile 


ggc 
gly 


ggc 
gly 


tec atg 
ser met 
421/141 


ggc 
gly 


cgc 
arg 


tac 
tyr 


ggc 
gly 


ggg 

gly 


gta 
vai 


tgg 
trp 


gcg 
ala 


cac gac 
his asp 
451/151 


gag 
glu 


act 
thr 


cgc 
arg 


aag 
lys 


teg 
ser 


ttc 
phe 


age 
ser 


ate 
ile 


get ggc 
ala gly 
481/161 


acg 
thr 


egg 
arg 


gtg 
vai 


gtc 
vai 


gat 
asp 


gcg 
ala 


ate 
ile 


aaa 
lys 


ctg teg 
leu ser 
511/171 


gtg 
vai 


ccg 
pro 


ttc 
phe 


caa 
gin 


act 
thr 


ctg 
leu 


ggc 
gly 


aag 

lys 


teg gtc 
ser vai 

^4 1 f\ AT 


gcg 
ala 


gac 
asp 


gac 
asp 


gcc 
ala 


ggg 

gly 


ctg 
leu 


gcg 
ala 


gcg 
ala 


aat gtg 
asn vai 


cgc 
arg 


gac 
asp 


gcc 
ala 


gtc 
vai 


ggc 
gly 


aac 
asn 


ttg 
leu 


gcc 
ala 



get gag gtc ggc tga 
ala glu vai gly OPA 



SEQ ID N° 14R 
FIGURE 14R 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



47/185 



ORF predite 


par 


Cole et 


al. 


{Nature 


393 


:537-544) 


et 


contenant Rv3054c 






1/1 


















31/11 


















taa cgc 
w ii ci jl y 
61/21 


gat 
asp 


egg 
arg 


aa t 
asn 


aaa 
lys 


teg 
ser 


gac 
asp 


cat 
his 


ggt 
gly 


ccg gtt 
pro val 
91/31 


ggc 
gly 


teg 
ser 


tgc 
cys 


aag 
lys 


gac 
asp 


gtg 
val 


gac 
asp 


caa 
gin 


caa gcg 

rjl n a 1 a 

121/41 


gaa 


agg 
arg 


aac 
asn 


gta 

x/a 1 
Vdl 


gca 
ala 


gtg 
val 


tea 
ser 


gat 
asp 


acc aag 
thr lys 
151/51 


tec 
ser 


gac 
asp 


ate 
ile 


aaa 
lys 


ate 
ile 


ttg 
leu 


gee 
ala 


tta 
leu 


gtg gga 
va 1 gly 
181/61 


age 


ctg 
leu 


cgc 
arg 


gcg 
axa 


gcg 
ala 


teg 
ser 


ttc 
pne 


aac 
asn 


cgc cag 
arg gin 
211/71 


ate 
ile 


gec 
ala 


gag 
glu 


ctg 
leu 


get 
ala 


gec 
ala 


aag 

lys 


gtc 
val 


get ccg 

a 1 a n rr> 

U ^ U ^/ ^ V 

241/81 


gac 
asp 


ggc 
gly 


gtc 

vdl 


acc 


gtc 
val 


acc 
tnr 


atg 
met 


ttc 
phe 


gag ggg 
glu gly 
271/91 


ctg 
leu 


ggg 

gly 


gac 
asp 


ctg 
leu 


ccg 
pro 


ttc 
phe 


tac 
tyr 


aac 
asn 


gaa gac 

y i u c* o 

301/101 


ate 
ile 


gac 
asp 


aca 

Lil L. 


gcg 

ala 


acg 
thr 


gag 
glu 


gtg 
val 


ccg 
pro 


gcg ccg 
ala pro 
331/111 


gtg 
val 


age 
ser 


gcg 
ala 


ttg 
leu 


egg 
arg 


gag 
glu 


gee 
ala 


gcg 
ala 


tct gac 

o ^ i, uoy 

361/121 


gcg 
ala 


cac 
his 


get 

ola 


gec 

ala 
aid 


ttg 
leu 


gtg 
val 


gtc 
val 


acg 
thr 


ccg gaa 
pro glu 
391/131 


tac 
tyr 


aac 
asn 


ggc 
gly 


age 
ser 


att 
ile 


ccg 
pro 


gee 
ala 


gtg 
val 


ate aag 
ile lys 
421/141 


a a c 
asn 


gcg 
ala 


ate 
ile 


gac 
asp 


tgg 
trp 


ctg 
leu 


tec 
ser 


agg 
arg 


cca ttc 
pro phe 
451/151 


ggc 
gly 


gat 
asp 


ggc 
gly 


gcg 
ala 


ttg 
leu 


aag 
lys 


gac 
asp 


aag 
lys 


ccg ttg 
pro leu 
481/161 


gec 
ala 


gtg 
val 


ate 
ile 


ggc 
gly 


ggc 
gly 


tec 
ser 


atg 
met 


ggc 
gly 


cgc tac 
arg tyr 
511/171 


ggc 
gly 


ggg 

gly 


gta 
val 


tgg 
trp 


gcg 
ala 


cac 
his 


gac 
asp 


gag 
glu 


act cgc 
thr arg 
541/181 


aag 
lys 


teg 
ser 


ttc 
phe 


age 
ser 


ate 
ile 


get 
ala 


ggc 
gly 


acg 
thr 


egg gtg 
arg val 
571/191 


gtc 
val 


gat 
asp 


gcg 
ala 


ate 
ile 


aaa 
lys 


ctg 
leu 


teg 
ser 


gtg 
val 


ccg ttc 
pro phe 
601/201 


caa 
gin 


act 
•thr 


ctg 
leu 


ggc 
gly 


aag 
lys 


teg 
ser 


gtc 
val 


gcg 
ala 


gac gac 
asp asp 
631/211 


gec 
ala 


ggg 

gly 


ctg 
leu 


gcg 
ala 


gcg 
ala 


aat 
asn 


gtg 
val 


cgc 
arg 


gac gec 
asp ala 


gtc 
val 


ggc 
gly 


aac 
asn 


ttg 
leu 


gee 
ala 


get 
ala 


gag 
glu 


gtc 
val 


ggc tga 
gly OPA 



















SEQ ID N° 14P 
FIGURE 14P 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



48/185 



fragment d'apres la sequence publiee par Cole et al. (Nature 393:537-544) et contenant 
seq 14F' et seq 14P' 

1/1 31/11 

taa cgc gat egg aat aaa teg gac cat ggt ccg gtt ggc teg tgc aag gac gtg gac caa 
OCH arg asp arg asn lys ser asp his gly pro val gly ser cys lys a3p val asp gin 
asn ala ile gly ile asn arg thr met val arg leu ala arg ala arg thr trp thr asn 
thr arg ser glu OCH ile gly pro trp ser gly trp leu val gin gly arg gly pro thr 
61/21 91/31 

caa gcg gaa agg aac gta gca gtg tea gat acc aag tec gac ate aaa ate ttg gee tta 
gin ala glu arg asn val ala val ser asp thr lys ser asp ile lys ile leu ala leu 
lys arg lys gly thr AMB gin cys gin ile pro ser pro thr ser lys ser trp pro AMB 
ser gly lys glu arg ser ser val arg tyr gin val arg his gin asn leu gly leu ser 
121/41 151/51 

gtg gga age ctg cgc gcg gcg teg ttc aac cgc cag ate gee gag ctg get gee aag gtc 
val gly ser leu arg ala ala ser phe asn arg gin ile ala glu leu ala ala lys val 
trp glu ala cys ala arg arg arg ser thr ala arg ser pro ser trp leu pro arg ser 
gly lys pro ala arg gly val val gin pro pro asp arg arg ala gly cys gin gly arq 
181/61 211/71 

get ccg gac ggc gtc acc gtc acc atg ttc gag ggg ctg ggg gac ctg ccg ttc tac aac 
ala pro asp gly val thr val thr met phe glu gly leu gly asp leu pro phe tyr asn 
leu arg thr ala ser pro ser pro cys ser arg gly trp gly thr cys arg ser thr thr 
ser gly arg arg his arg his his val arg gly ala gly gly pro ala val leu gin arg 
241/81 271/91 

gaa gac ate gac aca gcg acg gag gtg ccg gcg ccg gtg age gcg ttg egg gag gec gcg 
glu asp ile asp thr ala thr glu val pro ala pro val ser ala leu arg glu ala ala 
lys thr ser thr gin arg arg arg cys arg arg arg OPA ala arg cys gly arg pro arg 
arg his arg his ser asp gly gly ala gly ala gly glu arg val ala gly gly arq val 
301/101 331/111 

tct gac gcg cac get gec ttg gtg gtc acg ccg gaa tac aac ggc age att ccg gec gtg 
ser asp ala his ala ala leu val val thr pro glu tyr asn gly ser ile pro ala val 
leu thr arg thr leu pro trp trp ser arg arg asn thr thr ala ala phe arg pro OPA 
OPA arg ala arg cys leu gly gly his ala gly ile gin arg gin his ser gly arg asp 
361/121 3917131 

ate aag aac gcg ate gac tgg ctg tec agg cca ttc ggc gat ggc gcg ttg aag gac aag 
ile lys asn ala ile asp trp leu ser arg pro phe gly asp gly ala leu lys asp lys 
ser arg thr arg ser thr gly cys pro gly his ser ala met ala arg OPA arg thr ser 
gin glu argasp arg leu ala val gin ala ile arg arg trp arg val glu gly gin ala 
421/141 451/151 

ccg ttg gec gtg ate ggc ggc tec atg ggc cgc tac ggc ggg gta tgg gcg cac gac gag 
pro leu ala val ile gly gly ser met gly arg tyr gly gly val trp ala his asp glu 
arg trp pro OPA ser ala ala pro trp ala ala thr ala gly tyr gly arg thr thr arg 
val gly arg asp arg arg leu his gly pro leu arg arg gly met gly ala arg arq asp 
481/161 511/171 

act cgc aag teg ttc age ate get ggc acg egg gtg gtc gat gcg ate aaa ctg teg gtg 
thr arg lys ser phe 3er ile ala gly thr arg val val asp ala ile lys leu ser val 
leu ala ser arg ser ala ser leu ala arg gly trp ser met arg ser asn cys arg cys 
ser gin val val gin his arg trp his ala gly gly arg cys asp gin thr val gly ala 
541/181 571/191 

ccg ttc caa act ctg ggc aag teg gtc gcg gac gac gec ggg ctg gcg gcg aat gtg cgc 
pro phe gin thr leu gly lys ser val ala asp asp ala gly leu ala ala asn val arg 
arg ser lys leu trp ala ser arg ser arg thr thr pro gly trp arg arg met cys ala 
val pro asn ser gly gin val gly arg gly arg arg arg ala gly gly glu cys ala arq 
601/201 631/211 

gac gee gtc ggc aac ttg gec get gag gtc ggc tga tec ctg ggc cga ggc ggg tea gec 
asp ala val gly asn leu ala ala glu val gly OPA ser leu gly arg gly gly 3 er ala 
thr pro ser ala thr trp pro leu arg ser ala asp pro trp ala glu ala gly gin pro 
arg arg arg gin leu gly arg OPA gly arg leu He pro gly pro arg arg val ser qln 
661/221 691/231 

aat age ggc tec ate ggc ttt get ggt age ggt teg gcg gga age tag egg cga cgt tgt 
asn ser gly ser ile gly phe ala gly ser gly ser ala gly ser AMB arg arg arg cys 
ile ala ala pro ser ala leu leu val ala val arg arg glu ala ser gly asp val val 
AMB arg leu his arg leu cys trp AMB arg phe gly gly lys leu ala ala thr leu ser 



SEQ ID N° 14Q 



FEUILLE DE REM^ggMEJ^REGLE 26) 



WO 99/09186 



PO7FR98/01813 



49/185 



721/241 751/251 

egg tgg ccg gtg ata tat tgg gtc aga egg gta tgg egg egg ctg agg tga tct gcg aca 
arg trp pro val ile tyr trp val arg arg val trp arg arg leu arg OPA 3er ala thr 
gly gly arg OPA tyr ile gly ser asp gly tyr gly gly gly OPA gly asp leu arg his 
val ala gly asp ile leu gly gin thr gly met ala ala ala glu val ile cys asp thr 
781/261 811/271 

cgc cgc cgc ggt get cga gec agg ctt acg acc agg gaa ttt cga aaa tgt tat tea gaa 
arg arg arg gly ala arg ala arg leu thr thr arg glu phe arg lys cys tyr ser glu 
ala ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val ile gin asn 
pro pro arg cys aer ser gin ala tyr asp gin gly ile ser lys met leu phe arq thr 
841/281 871/291 

cat ctt gta tct ctt etc cgt gec acc ccc tag gtg tag tgt ttt cga gta ccg gca gat 
his leu val ser leu leu arg ala thr pro AMB val AMB cy3 phe arg val pro ala asp 
ile leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin ile 
ser cys ile ser ser pro cys his pro leu gly val val phe ser ser thr gly arg ser 
901/301 931/311 

ccc agg ttc acc agg tct cac cag ate cac ggg gcg cga tga act tec egg cat egg cat 
pro arg phe thr arg ser his gin ile his gly ala arg OPA thr ser arg his arg his 
pro gly ser pro gly leu thr arg ser thr gly arg asp glu leu pro gly ile gly ile 
gin val his gin val ser pro asp pro arg gly ala met asn phe pro ala ser ala ser 
961/321 991/331 

cgc cag gtc gac gga cgt ggt cgc get atg acg gga ate tgg age ctt gtc ggg ccg etc 
arg gin val asp gly arg gly arg ala met thr gly ile trp ser leu val gly pro leu 
ala arg ser thr asp val val ala leu OPA arg glu ser gly ala leu aer gly arg ser 
pro gly arg arg thr trp ser arg tyr asp gly asn leu glu pro cys arg ala ala aln 
1021/341 1051/351 

aac ata teg aag atg cac tac ttg agt cgt tgc cag ate ctg tea gat tec cga ttt ccg 
asn ile ser lys met his tyr leu ser arg cys gin ile leu ser asp ser arg phe pro 
thr tyr arg arg cys thr thr OPA val val ala arg ser cys gin ile pro asp phe arg 
his ile glu asp ala leu leu glu ser leu pro asp pro val arg phe pro ile ser ala 
1081/361 1111/371 
caa agg age ggt acg ccc atg acc gtg acc gtt tac act aa 
gin arg ser gly thr pro met thr val thr val tyr thr 
lys gly ala val arg pro OPA pro OPA pro phe thr leu 
lys glu arg tyr ala his asp arg asp arg leu his OCH 



SEQ ID N° 14Q (suite) 
FIGURE 14Q(suite) 



1/1 


















31/11 


















CAA GCC 


CGG 


CCG 


CGA 


CTG 


TTT 


GCC 


GTT 


TTG 


GGG CTC 


CTA 


CCA 


GAA 


CAC 


CAC 


CTG 


GCG 


GCC 


gin ala 


arg 


pro 


arg 


leu 


phe 


ala 


val 


leu 


gly leu 


leu 


pro 


glu 


his 


his 


leu 


ala 


ala 


61/21 


















91/31 














GCG CAC 


CAT 


GGT 


GTG 


CAC 


CAG 


TTG 


CGA 


TCG 


GTT CCT 


CCC 


GCG 


CGC 


GGG 


CGG 


CGA 


CGA 


CGT 


ala his 


his 


gly 


val 


his 


gin 


leu 


arg 


ser 


val pro 


pro 


ala 


arg 


gly 


arg 


arg 


arg 


arg 


121/41 


















151/51 








CGA TGC 


CCG 


CGC 


CCC 


GGC 


GGC 


GCA 


GCT 


GCG 


TAG CTC 


GAC 


CCG 


GTC 


GAC 


GAC 


GAC 


GGG 


GTC 


arg cys 


pro 


arg 


pro 


gly 


gly 


ala 


ala 


ala 


AMB leu 


asp 


pro 


val 


asp 


asp 


asp 


gly 


val 


181/61 


















211/71 










GGC GGA 


CCA 


GTC 


GGC 


GAT 


GTC 


GAG 


GCG 


ATG 


GCA ATA 


CAG 


CGC 


CTT 


GGT 


GCG 


CGG 


CCA 


CAC 


gly gly 


pro 


val 


gly 


asp 


val 


glu 


ala 


met 


ala ile 


gin 


arg 


leu 


giy 


ala 


arg 


pro 


his 


241/81 


















271/91 












GTC TGA 


GGT 


GGC 


GAA 


GAC 


CAG 


TCC 


CGC 


GCC 


CAC CGG 


CAG 


CCG 


GAT 


CCG 


GAT 


ACG 


CGG 


TAC 


val OPA 


gly 


gly 


glu 


asp 


gin 


ser 


arg 


ala 


his arg 


gin 


pro 


asp 


pro 


asp 


thr 


arg 


tyr 



SEQ ID N° 15A 



FEU1LLE DE RENlPLftJGSSI/lBl^T^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



50/185 





















32/11 


















AAG CCC 


GGC 


CGC 


GAC 


TGT 


TTG 


CCG 


TTT 


TGG 


GGC TCC 


TAC 


CAG 


AAC 


ACC 


ACC 


TGG 


CGG 


CCG 


lys pro 
62/21 


gly 


arg 


asp 


cys 


leu 


pro 


phe 


trp 


gly ser 
92/31 


tyr 


gin 


asn 


thr 


thr 


trp 


arg 


pro 


CGC ACC 


ATG 


GTG 


TGC 


ACC 


AGT 


TGC 


GAT 


CGG 


TTC CTC 


CCG 


CGC 


GCG 


GGC 


GGC 


GAC 


GAC 


GTC 


arg thr 


met 


val 


cys 


thr 


ser 


cys 


asp 


arg 


phe leu 


pro 


arg 


ala 


gly 


gly 


asp 


asp 


val 


122/41 


















152/51 










GAT GCC 


CGC 


GCC 


CCG 


GCG 


GCG 


CAG 


CTG 


CGT 


AGC TCG 


ACC 


CGG 


TCG 


ACG 


ACG 


ACG 


GGG 


TCG 


asp ala 


arg 


ala 


pro 


ala 


ala 


gin 


leu 


arg 


ser ser 


thr 


arg 


ser 


thr 


thr 


thr 


gly 


ser 


182/61 


















212/71 
















GCG GAG 


CAG 


TCG 


GCG 


ATG 


TCG 


AGG 


CGA 


TGG 


CAA TAC 


AGC 


GCC 


TTG 


GTG 


CGC 


GGC 


CAC 


ACG 


ala asp 


gin 


ser 


ala 


met 


ser 


arg 


arg 


trp 


gin tyr 


ser 


ala 


leu 


val 


arg 


gly 


his 


thr 


242/81 


















272/91 














TCT GAG 


GTG 


GCG 


AAG 


ACC 


AGT 


CCC 


GCG 


CCC 


ACC GGC 


AGC 


CGG 


ATC 


CGG 


ATA 


CGC 


GGT 


AC 


ser glu 


val 


ala 


lys 


thr 


ser 


pro 


ala 


pro 


thr gly 


ser 


arg 


ile 


arg 


ile 


arg 


gly 





SEQ ID N° 15B 
FIGURE 15B 





















33/11 


















AGC CCG 


GCC 


GCG 


ACT 


GTT 


TGC 


CGT 


TTT 


GGG 


GCT CCT 


ACC 


AGA 


ACA 


CCA 


CCT 


GGC 


GGC 


CGC 


ser pro 


ala 


ala 


thr 


val 


cys 


arg 


phe 


gly 


ala pro 


thr 


arg 


thr 


pro 


pro 


gly 


gly 


arg 


63/21 


















93/31 












GCA CCA 


TGG 


TGT 


GCA 


CCA 


GTT 


GCG 


ATC 


GGT 


TCC TCC 


CGC 


GCG 


CGG 


GCG 


GCG 


ACG 


ACG 


TCG 


ala pro 


trp 


cys 


ala 


pro 


val 


ala 


ile 


gly 


ser ser 


arg 


ala 


arg 


ala 


ala 


thr 


thr 


ser 


123/41 


















153/51 














ATG CCC 


GCG 


CCC 


CGG 


CGG 


CGC 


AGC 


TGC 


GTA 


GCT CGA 


CCC 


GGT 


CGA 


CGA 


CGA 


CGG 


GGT 


CGG 


met pro 


ala 


pro 


arg 


arg 


arg 


ser 


cys 


val 


ala arg 


pro 


gly 


arg 


arg 


arg 


arg 


gly 


arg 


183/61 


















213/71 












CGG ACC 


AGT 


CGG 


CGA 


TGT 


CGA 


GGC 


GAT 


GGC 


AAT ACA 


GCG 


CCT 


TGG 


TGC 


GCG 


GCC 


ACA 


CGT 


arg thr 


ser 


arg 


arg 


cys 


arg 


gly 


asp 


gly 


asn thr 


ala 


pro 


t rp 


cys 


ala 


ala 


thr 


arg 


243/81 


















273/91 












CTG AGG 


TGG 


CGA 


AGA 


CCA 


GTC 


CCG 


CGC 


CCA 


CCG GCA 


GCC 


GGA 


TCC 


GGA 


TAC 


GCG 


GTA 


C 


leu arg 


trp 


arg 


arg 


pro 


val 


pro 


arg 


pro 


pro ala 


ala 


gly 


ser 


gly 


tyr 


ala 


val 





SEQ ID N° 15C 
FIGURE 15C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



51/185 



partie de la sequence nucleot idique de seqlSA 



1/1 


















31/11 


















GGC GGC 


CGC 


GCG 


CCA 


TGG 


TGT 


GCA 


CCA 


GTT 


GCG ATC 


GGT 


TCT 


CCC 


GCG 


CGC 


GGG 


CGG 


CGA 


gly gly 


arg 


aia 


pro 


trp 


cys 


aia 


pro 


val 


aia ile 


gly 


ser 


pro 


aia 


arg 


gly 


arg 


arg 


61/21 


















91/31 










CGA CGT 


CGA 


TGG 


CCG 


CGC 


CCC 


GGC 


GGC 


TGC 


AGC TGC 


GTA 


GCT 


CGA 


CCC 


GGT 


CGA 


CGA 


CGA 


arg arg 


arg 


trp 


pro 


arg 


pro 


gly gly 


cys 


ser cys 


va 1 


aia 


arg 


pro 


gly 


arg 


arg 


arg 


121/41 


















151/51 










CGG GGT 


CGG 


CGG 


GCC 


AGT 


CGG 


CGA 


TGT 


CGA 


GGC GAT 


GGC 


AAT 


ACA 


GCG 


CCT 


TGG 


TGC 


GCG 


arg gly 


arg 


arg 


aia 


ser 


arg 


arg 


cys 


arg 


gly asp 


gly 


asn 


thr 


aia 


pro 


trp 


cys 


aia 


181/61 


















211/71 












GCC ACA 


CGT 


CTG 


AGG 


TGG 


CGA 


AGA 


CCA 


GTC 


CCG CGC 


CCA 


CCG 


GCA 


GCC 


GGA 


TC 






aia thr 


arg 


leu 


arg 


trp 


arg 


arg 


pro 


val 


pro ar] 


pro 


pro 


aia 


aia 


gly 









SEQ ID N° ISA ? 
FIGURE 15A' 



1/1 


















31/11 


















GCG GCC 


GCG 


CGC 


CAT 


GGT 


GTG 


CAC 


CAG 


TTG 


CGA TCG 


GTT 


CTC 


CCG 


CGC 


GCG 


GGC 


GGC 


GAC 


aia aia 
61/21 


aia 


arg 


his 


gly 


val 


his 


gin 


leu 


arg ser 
91/31 


val 


leu 


pro 


arg 


aia 


gly 


gly 


asp 


GAC GTC 


GAT 


GGC 


CGC 


GCC 


CCG 


GCG 


GCT 


GCA 


GCT GCG 


TAG 


CTC 


GAC 


CCG 


GTC 


GAC 


GAC 


GAC 


asp val 


asp 


gly 


arg 


aia 


pro 


aia 


aia 


aia 


aia aia 


AMB 


leu 


asp 


pro 


val 


asp 


asp 


asp 


121/41 


















151/51 








GGG GTC 


GGC 


GGG 


CCA 


GTC 


GGC 


GAT 


GTC 


GAG 


GCG ATG 


GCA 


ATA 


CAG 


CGC 


CTT 


GGT 


GCG 


CGG 


gly val 
181/61 


gly gly pro 


val 


gly 


asp 


val 


glu 


aia ir.et 
211/71 


aia 


ile 


gin 


arg 


leu 


gly 


aia 


arg 


CCA CAC 


GTC 


TGA 


GGT 


GGC 


GAA 


GAC 


CAG 


TCC 




CAC 


CGG 


CAG 


CCG 


GAT 


C 






pro his 


val 


OPA 


gly 


gly 


glu 


asp 


gin 


ser 


a rg a 1 i 


his 


arg 


gin 


pro 


asp 









SEQ ID N° 15B' 
FIGURE 15B' 



1/1 31/11 

TGG CGG CCG CGC GCC ATG GTG TGC ACC AGT TGC GAT CGG TTC TCC CGC GCG CGG GCG GCG 

trp arg pro arg aia met val cys thr ser cys aso arg ohe ser arg aia arg aia al» 
51/21 91/31 

ACG ACG TCG ATG GCC GCG CCC CGG CGG CTG CA3 CTG CGT AGC TCG ACC CGG TCG ACG ACG 

thr thr ser met aia aia pro arg arg leu gin Leu arg ser ser thr arg ser -h*- th- 
121/41 151/51 

ACG GGG TCG GCG GGC CAG TCG GCG ATG TCG AGG ZZ\ TGG CAA TAG AGC GCC TTG GTG CG: 

thr gly ser aia gly gin ser aia met ser arg arg tro gin tvr ser aia leu val ara 
181/61 211/71 

GGC CAC ACG TCT GAG GTG GCG AAG ACC AGT CCC 3 2G CCC ACC GGC AGC CGG ATC 

gly his thr ser glu val aia lys thr ser pro aia nro thr civ ser arg lie 



SEQ ID N° 15C 1 



FEUILLE DE RENtfSLAGSMEBI (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



52/185 



ORF contenant SeqlSA* d'apres Cole et al . (Nature 393:537-544) 
1/1 31/11 

taa ggt ccg cca acg ctt tac get cga egg ccg cca cga gtt ggc egg cca ctt tea ggc 
OCH gly pro pro thr leu tyr ala arg arg pro pro arg val gly arg pro leu ser qlv 
61/21 91/31 

cgt agt cgc cgc agg gca ggg ctt ccc gcg teg tct teg egg gtt tgt egg caa agg tgt 
arg ser arg arg arg ala gly leu pro ala ser ser ser arg val cys arq gin arq cvs 
121/41 151/51 

agg ggt age gtt cgt ggg cgt cga cga cga tgt gca get egg gga tgc egg egg cgc ggg 
arg gly ser val arg gly arg arg arg arg cys ala ala arg gly cys arg arg arg gly 
181/61 211/71 

egg tgg ggg tgc gca cgc ccg gee gcg act gtt tgc gcg ttt tgg ggc tct gec aga aca 
arg trp gly cys ala arg pro ala ala thr val cys ala phe trp gly ser ala arg thr 
241/81 271/91 

cca cct ggc ggc cgc gcg cca tgg tgt gca cca gtt gcg ate ggt tct ccc gcg cgc ggg 
pro pro gly gly arg ala pro trp cys ala pro val ala ile glv ser pro ala arq civ 
301/101 331/111 

egg cga cga cgt cga tgg ccg cgc ccc ggc ggc tgc age tgc gta get cga ccc ggt cga 
arg arg arg arg arg trp pro arg pro gly gly cys ser cys val ala arg pro gly arg 
361/121 391/131 

cga cga egg ggt egg egg gee agt egg cga tgt cga ggc gat ggc aat aca gcg cct tgg 
arg arg arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro trp 
421/141 451/151 

tgc gcg gee aca cgt ctg agg tgg cga aga cca gtc ccg cgc cca ccg gca gee gga tea 
cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly ser 
481/161 511/171 

ggt agg gca ggc gcg agt ctt cag egg ggt tgg egg cga cga gca get cca cag agt gtg 
gly arg ala gly ala ser leu gin arg gly trp arg arg arg ala ala pro gin ser val 
541/181 571/191 

agg gta egg gcg gcg tac ggc aac ggt gaa gca ggc act ccg acg aac cca teg tea cgt 
arg val arg ala ala tyr gly asn gly glu ala gly thr dto thr asn oro ser ser arq 
601/201 

cga agg ggc agg tga 
arg arg gly arg OPA 



SEQ ID N° 15F 
FIGURE 15F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



53/185 



R:Rv2530c predite c 
phase avec SEQ15A 
1/1 

gtg acg gca ctg etc 
val thr ala leu leu 
61/21 

cat gcg gec gcg cag 
his ala ala ala gin 
121/41 

ate acc gag gca ggg 
ile thr glu ala gly 
181/61 

acg ccg get ate gcg 
thr pro ala ile ala 
241/81 

tgg cct gac gat gtg 
trp pro asp asp val 
301/101 

cac cgt egg gtc acc 
his arg arg val thr 
361/121 

gtc aca ttc gat gec 
val thr phe asp ala 



'apres Cole et al. (Nature 393 : 537-54 4 ) et pouvant etre en 



gat gtc 
asp val 

cga tgg 
arg trp 

tat gtc 
tyr val 

ate get 
ile ala 

cca ctg 
pro leu 

gac tgc 
asp cys 

gca ctg 
ala leu 



aat gtg 
asn val 

ttc acg 
phe thr 

cga att 
arg ile 

cag ttg 
gin leu 

ate gtt 
ile val 

cat etc 
his leu 

gec gat 
ala asp 



31/11 
ctg ate gcg 
leu ile ala 

91/31 
cag ttc tec 
gin phe ser 

151/51 
tea age aat 
ser ser asn 

211/71 
gcg gcg atg 
ala ala met 

271/91 
ggg age gee 
gly ser ala 

331/111 
ate gee ttg 
ile ala leu 

391/131 
tea gca tec 
ser ala ser 



ctg 
leu 

teg 
ser 

cgc 
arg 

act 
thr 

ggc 
gly 

gec 
ala 

gca 
ala 



ggc tgg ccg aat cac gtt cac 

gly trp pro asn his val his 

aat ggg tgg gee acc acg ccg 

asn gly trp ala thr thr pro 

agt gtg atg cag gtg teg acc 

ser val met gin val ser thr 

tct ctt gec ggg cac acg ttt 

ser leu ala gly his thr phe 

gat cgc gat gcg gtg tec aac 

asp arg asp ala val ser asn 

gcg cgc tac ggg ggc egg ttg 

ala arg tyr gly gly arg leu 

ggc etc gtc gag gtg ttg tag 

gly leu val glu val leu AMB 



SEQ ID N° 15R 
FIGURE 15R 



SeqlSP: 
1/1 

tga tgt 
OPA cys 
61/21 
cga cgt 
arg arg 
121/41 
gtt cac 
val his 
181/61 
acg ccg 
thr pro 
241/81 
teg acc 
ser thr 
301/101 
acg ttt 
thr phe 
361/121 
tec aac 
ser asn 
421/141 
egg ttg 
arg leu 
4 81/161 
ttg tag 
leu AMB 



ORF d 1 apres Cole et al . (Nature 



tec gec gga 
ser ala gly 

gtg acg gca 
val thr ala 

cat gcg gee 
his ala ala 

ate acc gag 
ile thr glu 

acg ccg get 
thr pro ala 

tgg cct gac 
trp pro asp 

cac cgt egg 
his arg arg 

gtc aca ttc 
val thr phe 



tgc gee 
cys ala 

ctg etc 
leu leu 

gcg cag 
ala gin 

gca ggg 
ala gly 

ate gcg 
ile ala 

gat gtg 
asp val 

gtc acc 
val thr 

gat gec 
aso ala 



gac 
asp 

gat 
asp 

cga 
arg 

tat 
tyr 

ate 
ile 

cca 
pro 

gac 
asp 

gca 
ala 



ggt gac 
gly asp 

gtc aat 
val asn 

tgg ttc 
trp phe 

gtc cga 
val arg 

get cag 
ala gin 

ctg ate 
leu lie 

tgc cat 
cys his 

ctg gec 
leu ala 



393:537- 
31/11 
ttc cga 
phe arg 
91/31 
gtg ctg 
val leu 
151/51 
acg cag 
thr gin 
211/71 
att tea 
ile ser 
271/91 
ttg gcg 
leu ala 
331/111 
gtt ggg 
val gly 
391/131 
etc ate 
leu ile 
451/151 
gat tea 
aso ser 



544) contenant Rv2530c 

gga tgt cgt ccg cgc get cga gga 

gly cys arg pro arg ala arg gly 

ate gcg ctg ggc tgg ccg aat cac 

ile ala leu gly trp pro asn his 

ttc tec teg aat ggg tgg gec acc 

phe ser ser asn gly trp ala thr 

age aat cgc agt gtg atg cag gtg 

ser asn arg ser val met gin val 

gcg atg act tct ctt gee ggg cac 

ala met thr ser leu ala gly his 

age gec ggc gat cgc gat gcg gtg 

ser ala gly asp arg asp ala val 

gec ttg gec gcg cgc tac ggg ggc 

ala leu ala ala arg tyr gly gly 

gca tec gca ggc etc gtc gag gtg 

ala ser ala gly leu vai glu val 



SEQ ID N° 15P 



FEU1LLE DE REWip^^EWI^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



54/185 



Fragment contenant SeqlSP' et Seq 15F* 
1/1 31/11 

tga tgt tec gec gga tgc gec gac ggt gac ttc cga gga tgt cgt ccg cgc get cga gga 
OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 
asp val pro pro asp ala pro thr val thr ser glu asp val val arg ala leu glu asp 
Met phe arg arg met arg arg arg OPA leu pro arg met ser ser ala arq ser ara thr 
61/21 91/31 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg ggc tgg ccg aat cac 
arg arg val thr ala leu leu asp val asn val leu ile ala leu gly trp pro asn hi3 
asp val OPA arg his cys ser met ser met cy3 OPA ser arg trp ala gly arg ile thr 
thr cys asp gly thr ala arg cys gin cys ala asp arg ala gly leu ala glu ser arg 
121/41 151/51 

gtt cac cat gcg gec gcg cag cga tgg ttc acg cag ttc tec teg aat ggg tgg gec ace 
val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 
phe thr met arg pro arg ser asp gly ser arg ser ser pro arg met gly gly pro pro 
ser pro cys gly arg ala ala met val his ala val leu leu glu trp val aly his his 
181/61 211/71 

acg ccg ate acc gag gca ggg tat gtc cga att tea age aat cgc agt gtg atg cag gtg 
thr pro ile thr glu ala gly tyr val arg ile ser ser asn arg ser val met gin val 
arg arg ser pro arg gin gly met ser glu phe gin ala lie ala val OPA cys arg cys 
ala asp his arg gly arg val cy3 pro asn phe lys gin ser gin cys asp ala aly val 
241/81 271/91 

teg acc acg ccg get ate gcg ate get cag ttg gcg gcg atg act tct ctt gee ggg cac 
ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala gly his 
arg pro arg arg leu ser arg ser leu ser trp arg arg OPA leu leu leu pro gly thr 
asp his ala gly tyr arg asp arg ser val gly gly a3p asp phe ser cys arg ala his 
301/101 331/111 

acg ttt tgg cct gac gat gtg cca ctg ate gtt ggg age gee ggc gat cgc gat gcg gtg 
thr phe trp pro asp asp val pro leu ile val gly ser ala gly asp arg asp ala val 
arg phe gly leu thr met cys his OPA ser leu gly ala pro ala ile ala met arg cys 
val leu ala OPA arg cys ala thr asp arg trp glu arg arg arg ser arg cys gly val 
361/121 391/131 

tec aac cac cgt egg gtc acc gac tgc cat etc ate gec ttg gee gcg cgc tac ggg ggc 
ser asn his arg arg val thr asp cys his leu ile ala leu ala ala arg tyr gly gly 
pro thr thr val gly ser pro thr ala ile ser ser pro trp pro arg ala thr gly ala 
gin pro pro ser gly his arg leu pro 3er his arg leu gly arg ala leu arg gly pro 
421/141 451/151 

egg ttg gtc aca ttc gat gee gca ctg gee gat tea gca tec gca ggc etc gtc gag gtg 
arg leu val thr phe asp ala ala leu ala asp ser ala ser ala gly leu val glu val 
gly trp ser his ser met pro his trp pro ile gin his pro gin ala ser ser arg cys 
val gly his ile arg cys arg thr gly arg phe ser ile arg arg pro arg arg qly val 
481/161 511/171 

ttg tag tea ccg ggg atg ggc ggc teg cca ggc ctg cag gat ctg egg gcg cag gcg ccc 
leu AMB ser pro gly met gly gly ser pro gly leu gin asp leu arg ala gin ala pro 
cys ser his arg gly trp ala ala arg gin ala cys arg ile cys gly arg arg arg pro 
val val thr gly asp gly arg leu ala arg pro ala gly ser ala gly ala gly ala pro 
541/181 571/191 

ccg gtc gga cac egg cag gee gac get ttt ggc cca cgc gcg cag etc ggc get get ggg 
pro val gly his arg gin ala asp ala phe gly pro arg ala gin leu gly ala ala gly 
arg ser asp thr gly arg pro thr leu leu ala his ala arg ser ser ala leu leu gly 
gly arg thr pro ala gly arg arg phe trp pro thr arg ala ala arg arg cys trp ala 
601/201 631/211 

etc ggg etc ggc ggc age egg etc gaa aac cgt ggt ggc gtc ggc ate gtc gac gaa cca 
leu gly leu gly gly ser arg leu glu asn arg gly gly val gly lie val asD glu pro 
ser gly ser ala ala ala gly ser lys thr val val ala ser ala ser ser thr asn gin 
arg ala arg arg gin pro ala arg lys pro trp trp arg arg his arg arg arg thr arg 



SEQ ID N° 15Q 

FIGURE 15Q 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PO7FR98/01813 



55/185 



661/221 691/231 

ggt gag ggc ggc ggc tag ata gcg gta ggt gta ttc ctg ggc gag ctt gcg ggt ttg gca 
gly glu gly gly gly AMB ile ala val gly val phe leu gly glu leu ala gly leu ala 
val arg ala ala ala arg AMB arg AMB val tyr ser trp ala ser leu arg val trp gin 
OPA gly arg arg leu asp ser gly arg cys ile pro gly arg ala cys gly phe gly arq 
721/241 751/251 

gaa cac gat egg cac gtt ggg aaa gec gat ctg caa ttc ggc cag ccc ate ggc gat cgc 
glu hi3 asp arg his val gly lys ala asp leu gin phe gly gin pro ile gly asp arg 
asn thr ile gly thr leu gly ly3 pro ile cys asn ser ala ser pro ser ala ile ala 
thr arg ser ala arg trp glu 3er arg ser ala ile arg pro ala his arg arg ser pro 
781/261 811/271 

cgt egg gcg ggc gaa gga gtg cgc gaa gat etc cga gta gcg gtc etc gac cac cac ggc 
arg arg ala gly glu gly val arg glu asp leu arg val ala val leu asp his his gly 
val gly arg ala lys glu cys ala lys ile ser glu AMB arg ser ser thr thr thr ala 
ser gly gly arg arg ser ala arg arg ser pro ser ser gly pro arg pro pro arg arg 
841/281 871/291 

ggc ccg tgg cag cgc ggc cag ttc ggt cag ttg gta ttt cag gtt gec gtt cag cac gec 
gly pro trp gin arg gly gin phe gly gin leu val phe gin val ala val gin his ala 
ala arg gly ser ala ala ser ser val ser trp tyr phe arg leu pro phe ser thr pro 
pro val ala ala arg pro val arg ser val gly ile ser gly cys arg ser ala arg gin 
901/301 931/311 

aga agt aag gtc cgc caa cgc ttt acg etc gac ggc cgc cac gag ttg gec ggc cac ttt 
arg ser lys val arg gin arg phe thr leu asp gly arg his glu leu ala gly his phe 
glu val arg ser ala asn ala leu arg ser thr ala ala thr ser trp pro ala thr phe 
lys OCH gly pro pro thr leu tyr ala arg arg pro pro arg val gly arg pro leu ser 
961/321 991/331 

cag gec gta gtc gec gca ggg cag ggc ttc ccg cgt cgt ctt cgc ggg ttt gtc ggc aaa 
gin ala val val ala ala gly gin gly phe pro arg arg leu arg gly phe val gly lys 
arg pro AMB ser pro gin gly arg ala ser arg val val phe ala gly leu ser ala lys 
gly arg ser arg arg arg ala gly leu pro ala ser ser 3er arg val cys arg gin arq 
1021/341 1051/351 

ggt gta ggg gta gcg ttc gtg ggc gtc gac gac- gat gtg cag ccc ggg gat gec ggc ggc 
gly val gly val ala phe val gly val asp asp asp val gin leu gly asp ala gly gly 
val AMB gly AMB arg ser trp ala ser thr thr met cys ser ser gly met pro ala ala 

cys arg gly ser val arg gly arg arg arg arg cys ala ala arg gly cys arg arg arg 
1081/361 1111/371 

gcg ggc ggt ggg ggt gcg cac gec egg ccg cga ctg ttt gcg cgt ttt ggg get ctg cca 
ala gly gly gly gly ala his ala arg pro arg leu phe ala arg phe gly ala leu pro 
arg ala val gly val arg thr pro gly arg asp cys ieu arg val leu gly leu cys gin 
gly arg trp gly cys ala arg pro ala ala thr val cys ala phe trp gly ser ala arg 
1141/381 1171/391 

gaa cac cac ctg gcg gec gcg cgc cat ggt gtg cac cag ttg cga teg gtt etc ccg cgc 
glu his hi3 leu ala ala ala arg his gly val his gin leu arg ser val leu pro arg 
asn thr thr trp arg pro arg ala met val cys thr ser cys asp arg phe ser arg ala 
thr pro pro gly gly arg ala pro trp cy3 ala pro val ala lie gly ser pro ala arg 
1201/401 1231/411 

gcg ggc ggc gac gac gtc gat ggc cgc gee ccg gcg get gca get gcg tag etc gac ccg 
ala gly gly asp asp val asp gly arg ala pro ala ala ala ala ala AMB leu asp pro 
arg ala ala thr thr ser met ala ala pro arg arg leu gin leu arg ser ser thr arg 
gly arg arg arg arg arg trp pro arg pro gly gly cys ser cvs val ala arg pro gly 
1261/421 1291/431 

gtc gac gac gac ggg gtc ggc ggg cca gtc ggc gat gtc gag gcg atg gca ata cag cgc 
val asp asp asp gly val gly gly pro val gly asp val glu ala met ala ile gin arg 
ser thr thr thr gly ser ala gly gin ser ala met ser arg arg trp gin tyr ser ala 
arg arg arg arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro 



SEQ ID N° 15Q (suite 1) 
FIGURE 15Q (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



56/185 



1321/441 1351/451 

ctt ggt gcg egg cca cac gtc tga ggt ggc gaa gac cag tec cgc gec cac egg cag ccg 
leu gly ala arg pro his val OPA gly gly glu asp gin ser arg ala his arg gin pro 
leu val arg gly hi3 thr ser glu val ala lys thr ser pro ala pro thr gly ser arg 
trp cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly 
1381/461 1411/471 

gat cag gta ggg cag gcg cga gtc ttc age ggg gtt ggc ggc gac gag cag etc cac aga 
asp gin val gly gin ala arg val phe ser gly val gly gly asp glu gin leu his arg 
ile arg AMB gly arg arg glu ser ser ala gly leu ala ala thr ser ser ser thr glu 
ser gly arg ala gly ala ser leu gin arg gly trp arg arg arg ala ala pro gin ser 
1441/481 1471/491 

gtg tga ggg tac ggg egg cgt acg gca acg gtg aag cag gca etc cga cga acc cat cgt 
val OPA gly tyr gly arg arg thr ala thr val lys gin ala leu arg arg thr his arg 
cys glu gly thr gly gly val arg gin arg OPA ser arg his ser asp glu pro ile val 
val arg val arg ala ala tyr gly asn gly glu ala gly thr pro thr asn pro ser ser 
1501/501 

cac gtc gaa ggg gca ggt ga 
his val glu gly ala gly 
thr ser lys gly gin val 
arg arg arg gly arg OPA 



SEQ ID N° 15Q (suite 2) 
FIGURE 15Q (suite (2) 



31/11 



TGC GCA 


TGC 


CGA 


CCA 


GTG 


TGG 


TTG 


GCC 


GGA 


GTT CGT 


TTG 


TTC 


GCG 


ATT 


GCC 


TCA 


ACG 


ATT 


cys ala 


cys 


arg 


pro 


val 


trp 


leu 


ala 


gly 


val arg 


leu 


phe 


ala 


ile 


ala 


ser 


thr 


ile 


61/21 


















91/31 
















CGA TAT 


AAC 


CAC 


TCT 


AGT 


CAC 


ATC 


AAC 


CAC 


ACT CGT 


ACC 


ATC 


GAG 


CGT 


GTG 


GGT 


TCA 


TGC 


arg tyr 


asn 


his 


ser 


ser 


his 


ile 


asn 


his 


thr arg 


thr 


ile 


glu 


arg 


val 


gly 


ser 


cys 


121/41 


















151/51 












CAT GCA 


TTC 


GCG 


ACC 


GCG 


GGA 


GCC 


GGC 


GAA 


CCC GGC 


GCC 


ACA 


CAT 


AAT 


CCA 


GAT 


TGA 


GGA 


his ala 


phe 


ala 


thr 


ala 


gly 


ala 


gly 


glu 


pro gly 


ala 


thr 


his 


asn 


pro 


asp 


OPA 


gly 


181/61 


















211/71 












GAC TTC 


CGT 


GCC 


GAA 


CCG 


ACG 


CCG 


ACG 


CAA 


GCT TTC 


GAC 


AGC 


CAT 


GAG 


CGC 


GGT 


CGC 


CGC 


asp phe 


arg 


ala 


glu 


pro 


thr 


pro 


thr 


gin 


ala phe 


asp 


ser 


his 


glu 


arg 


gly 


arg 


arg 


241/81 


















271/91 










CCT GGC 


AGT 


TGC 


AAG 


TCC 


TTG 


TGC 


ATA 


TTT 


TCT TGT 


CTA 


CGA 


ATC 


AAC 


CGA 


AAC 


GAC 


CGA 


pro gly 


ser 


cys 


lys 


ser 


leu 


cys 


ile 


phe 


ser cys 


leu 


arg 


ile 


asn 


arg 


asn 


asp 


arg 


301/101 


















331/111 














GCG GCC 


CGA 


GCA 


CCA 


TGA 


ATT 


CAA 


GCA 


GGC 


GGC GGT 


GTT 


GAC 


CGA 


CCT 


GCC 


CGG 


CGA 


GCT 


ala ala 


arg 


ala 


pro 


OPA 


ile 


gin 


ala 


gly 


gly gly 


val 


asp 


arg 


pro 


ala 


arg 


arg 


ala 


361/121 


















391/131 














GAT GTC 


CGC 


GCT 


ATC 


GCA 


GGG 


GTT 


GTC 


CCA 


GTT CGG 


GAT 


C 














asp val 


arg 


ala 


ile 


ala 


gly 


val 


val 


pro 


val arg 


asp 

















SEQ ID N° 16A 
FIGURE 16A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



57/185 



32/11 



GCG CAT 


GCC 


GAC 


CAG 


TGT 


GGT 


TGG 


CCG 


GAG 


TTC GTT 


TGT 


TCG 


CGA 


TTG 


CCT 


CAA 


CGA 


TTC 


ala his 


ala 


asp 


gin 


cys 


gly 


trp 


pro 


glu 


phe val 


cys 


ser 


arq 


leu 


pro 


ain 


arg 


phe 


62/21 


















92/31 










GAT ATA 


ACC 


ACT 


CTA 


GTC 


ACA 


TCA 


ACC 


ACA 


CTC GTA 


CCA 


TCG 


AGC 


GTG 


TGG 


GTT 


CAT 


GCC 


asp ile 


thr 


thr 


leu 


val 


thr 


ser 


thr 


thr 


leu val 


pro 


ser 


ser 


val 


trD 


val 


his 


ala 


122/41 


















152/51 
















ATG CAT 


TCG 


CGA 


CCG 


CGG 


GAG 


CCG 


GCG 


AAC 


CCG GCG 


CCA 


CAC 


ATA 


ATC 


CAG 


ATT 


GAG 


GAG 


met his 


ser 


arg 


pro 


arg 


glu 


pro 


ala 


asn 


pro ala 


pro 


his 


ile 


ile 


gin 


ile 


gl u 


qlu 


182/61 


















212/71 












ACT TCC 


GTG 


CCG 


AAC 


CGA 


CGC 


CGA 


CGC 


AAG 


CTT TCG 


ACA 


GCC 


ATG 


AGC 


GCG 


GTC 


GCC 


GCC 


thr ser 


val 


Dro 


asn 


arg 


arg 


arg 


arg 


lys 


leu ser 


thr 


did 


me t 


ser 


ala 


val 


ala 


ala 


242/81 


















272/91 


















CTG GCA 


GTT 


GGA 


AGT 


CCT 


TGT 


GCA 


TAT 


TTT 


CTT GTC 


TAC 


GAA 


TCA 


ACC 


GAA 


ACG 


ACC 


GAG 


leu ala 


val 


ala 


ser 


pro 


cys 


ala 


tyr 


phe 


leu val 


tyr 


glu 


ser 


thr 


glu 


thr 


thr 


glu 


7 Pi o / 1 n 1 


















332/111 














CGG CCC 


GAG 


CAC 


CAT 


GAA 


TTC 


AAG 


CAG 


GCG 


GCG GTG 


TTG 


ACC 


GAC 


CTG 


CCC 


GGC 


GAG 


CTG 


arg pro 


glu 


his 


his 


glu 


phe 


lys 


gin 


ala 


ala val 


leu 


thr 


asp 


leu 


pro 


gly 


glu 


leu 


•J / 16 1 


















392/131 












ATG TCC 


GCG 


CTA 


TCG 


CAG 


tzriri 


lib 


TCC 


CAG 


TCC GGG 


ATC 
















ITlG t S 6 IT 


ala 


leu 


ser 


gin 


gly 


leu 


ser 


gin 


phe gly 


ile 






























SEQ ID 


N° 16B 






























FIGURE 16B 




































33/11 


















CGC ATG 


CCG 


ACC 


AGT 


GTG 


GTT 


GGC 


CGG 


AGT 


TCG TTT 


GTT 


CGC 


GAT 


TGC 


CTC 


AAC 


GAT 


TCG 


arg met 


pro 


thr 


ser 


val 


val 


gly 


arg 


ser 


ser phe 


val 


a ro 


asD 


c vs 


leu 


asn 


a s d 


ser 


63/21 


















93/31 












ATA TAA 


CCA 


CTC 


TAG 


TCA 


CAT 


CAA 


CCA 


CAC 


TCG TAC 


CAT 


CGA 


GCG 


TGT 


GGG 


TTC 


ATG 


CCA 


ile OCH 


pro 


leu 


AMB 


ser 


his 


gin 


pro 


his 


ser tyr 


his 


a rq 


ala 


cys 


al v 


phe 


me t 


pro 


123/41 


















153/51 












TGC ATT 


CGC 


GAC 


CGC 


GGG 


AGC 


CGG 


CGA 


ACC 


CGG CGC 


CAC 


ACA 


TAA 


TCC 


AGA 


TTG 


AGG 


AGA 


cys ile 


arg 


asp 


arg 


gly 


ser 


arg 


arg 


thr 


arg arg 


his 


thr 


OCH 


ser 


arg 


leu 


arg 


arg 


183/61 


















213/71 












CTT CCG 


TGC 


CGA 


ACC 


GAC 


GCC 


GAC 


GCA 


AGC 


TTT CGA 


CAG 


CCA 


TGA 


GCG 


CGG 


TCG 


CCG 


CCC 


leu pro 


cys 


arg 


thr 


asp 


ala 


asp 


ala 


ser 


phe arg 


gin 


pro 


OPA 


ala 


a rg 


ser 


pro 


pro 


243/81 


















273/91 
















TGG CAG 


TTG 


CAA 


GTC 


CTT 


GTG 


CAT 


ATT 


TTC 


TTG TCT 


ACG 


AAT 


CAA 


CCG 


AAA 


CGA 


CCG 


AGC 


trp gin 


leu 


gin 


val 


leu 


val 


his 


ile 


phe 


leu ser 


thr 


asn 


gin 


pro 


lys 


arg 


pro 


ser 


303/101 


















333/111 










GGC CCG 


AGC 


ACC 


ATG 


AAT 


TCA 


AGC 


AGG 


CGG 


CGG TGT 


TGA 


CCG 


ACC 


TGC 


CCG 


GCG 


AGC 


TGA 


gly pro 


ser 


thr 


met 


asn 


ser 


ser 


arg 


arg 


arg cys 


OP A 


pro 


thr 


cys 


pro 


ala 


ser 


OPA 


363/121 


















393/131 
















TGT CCG 


CGC 


TAT 


CGC 


AGG 


GGT 


TGT 


CCC 


AGT 


TCG GGA 


TC 
















cys pro 


arg 


t y r 


arg 




gly 


cys 


pro 


ser 


ser gly 



















SEQ ID N° 16C 
FIGURE 16C 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



58/185 



31/11 



GCG GGC 


CAC 


CGA 


TCA 


GTC 


GAT 


CGG 


GTG 


GTT 


TCC GCT 


CCA 


TCA 


GCC 


CGG 


AAT 


TGA 


GGT 


GCC 


ala gly 


his 


arg 


ser 


val 


asp 


arg 


val 


val 


ser ala 


pro 


ser 


ala 


arg 


asn 


OPA 


y x y 


aid 


61/21 


















91/31 














GCA GTG 


ACG 


ACA 


CCA 


GCG 


CAG 


GAC 


GCG 


CCG 


TTG GTG 


TTT 


CCC 


TCT 


GTT 


GCT 


TTC 


CCG 


TCC 


ala val 


thr 


thr 


pro 


ala 


gin 


asp 


ala 


pro 


leu val 


phe 


pro 


ser 


val 


ala 


phe 


pro 


ser 


121/41 


















151/51 














GGC TCG 


CCT 


TTT 


TTT 


CAT 


CAA 


CGT 


TGG 


ACT 


GCC GCA 


GTG 


GCG 


ATG 


TTG 


GTC 


GCC 


GGC 


GTG 


gly ser 


pro 


phe 


phe 


his 


aln 


ara 


trp 


thr 


ala ala 


val 


ala 


rue t 


leu 


Vdl 


did 


gly 


va l 


181/61 


















211/71 
















TTC GGT 


CAC 


CTG 


ACG 


GTC 


GGG 


ATG 


TTC 


CTT 


GGG TCT 


CGG 


GTT 


GCT 


GCT 


GGG 


TTT 


GCT 


CAA 


phe gly 


his 


leu 


thr 


val 


gly 


met 


phe 


leu 


gly ser 


arg 


val 


ala 


ala 


gly 


phe 


ala 


gin 


0 A 1 } / R 1 


















271/91 












TGC CCT 


GCT 


GGT 


GCG 


GCG 


TTC 


GGC 


CGA 


GTC 


GAT CAC 


CGC 


CAA 


AGA 


GCA 


CCC 


GTT 


AAA 


ACG 


cys pro 


ala 


gly 


ala 


ala 


phe 


gly 


arg 


val 


asp his 


arg 


gin 


arg 


ala 


pro 


val 


lys 


thr 


301/101 


















331/111 














GTC GAT 


GGC 


CCT 


CAA 


CTC 


GGC 


ATP 


GCG 


ACT 


GGC GAT 


TAT 


CAC 


CAT 


GCC 


TCG 


GGC 


TGA 


TC 


val asp 


a 1 V 

y x y 


pro 


gin 




gly 


X J- tr 


ala 


thr 


gly asp 


tyr 


his 


nis 


ala 


ser 


gly 


OPA 


















SEQ ID 


N° 17A 






























FIGURE 17A 




































32/11 


















CGG GCC 


ACC 


GAT 


CAG 


TCG 


ATC 


GGG 


TGG 


TTT 


CCG CTC 


CAT 


CAG 


CCC 


GGA 


ATT 


GAG 


GTG 


CCG 


arg ala 


thr 


asp 


gin 


ser 


ile 


gly 


trp 


phe 


pro leu 


his 


gin 


pro 


ql V 


ile 


alu 


val 


CIO 


62/21 


















92/31 














CAG TGA 


CGA 


CAC 


CAG 


CGC 


AGG 


ACG 


CGC 


CGT 


TGG TGT 


TTC 


CCT 


CTG 


TTG 


CTT 


TCC 


CGT 


CCG 


gin OPA 


arg 


his 


gin 


arg 


arg 


thr 


arg 


arg 


trp cys 


phe 


pro 


leu 


leu 


leu 


ser 


arg 


pro 


122/41 


















152/51 












GCT CGC 


CTT 


TTT 


TTC 


ATC 


AAC 


GTT 


GGA 


CTG 


CCG CAG 


TGG 


CGA 


TGT 


TGG 


TCG 


CCG 


GCG 


TGT 


ala arg 


leu 


phe 


phe 


ile 


asn 


val 


gly 


leu 


pro gin 


trp 


arg 


cys 


trp 


ser 


pro 


ala 


cys 


182/61 


















212/71 








TCG GTC 


ACC 


TGA 


CGG 


TCG 


GGA 


TGT 


TCC 


TTG 


GGT CTC 


GGG 


TTG 


CTG 


CTG 


GGT 


TTG 


CTC 


AAT 


ser val 


thr 


OPA 


arg 


ser 


gly 


cys 


ser 


leu 


gly leu 


gly 


leu 


leu 


leu 


gly 


leu 


leu 


asn 


242/81 


















272/91 
















GCC CTG 


CTG 


GTG 


CGG 


CGT 


TCG 


GCC 


GAG 


TCG 


ATC ACC 


GCC 


AAA 


GAG 


CAC 


CCG 


TTA 


AAA 


CGG 


ala leu 


leu 


val 


arg 


arg 


ser 


ala 


glu 


ser 


ile thr 


ala 


lys 


glu 


his 


pro 


leu 


lys 


arg 


302/101 


















332/111 














TCG ATG 


GCC 


CTC 


AAC 


TCG 


GCA 


TCG 


CGA 


CTG 


GCG ATT 


ATC 


ACC 


ATG 


CCT 


CGG 


GCT 


GAT 


C 


ser met 


ala 


leu 


asn 


ser 


ala 


ser 


arg 


leu 


ala ile 


ile 


thr 


met 


pro 


arg 


ala 


asp 





SEQ ID N° 17B 
FIGURE 17B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



59/185 

33/11 



GGG CCA 


CCG 


ATC 


AGT 


CGA 


TCG 


GGT 


GGT 


TTC 


CGC TCC 


ATC 


AGC 


CCG 


GAA 


TTG 


AGG 


TGC 


CGC 


gly pro 


pro 


ile 


ser 


arg 


ser 


gly 


gly 


phe 


arg ser 


ile 


ser 


pro 


glu 


leu 


arc 


CVS 


arg 


63/21 


















93/31 












AGT GAC 


GAC 


ACC 


AGC 


GCA 


GGA 


CGC 


GCC 


GTT 


GGT GTT 


TCC 


CTC 


TGT 


TGC 


TTT 


CCC 


GTC 


CGG 


ser asp 


asp 


thr 


ser 


ala 


gly 


arg 


ala 


val 


gly val 


ser 


leu 


cys 


cys 


phe 


pro 


val 


arg 


123/41 


















153/51 














CTC GCC 


TTT 


TTT 


TCA 


TCA 


ACG 


TTG 


GAC 


TGC 


CGC AGT 


GGC 


GAT 


GTT 


GGT 


CGC 


CGG 


CGT 


GTT 


leu ala 


phe 


phe 


ser 


ser 


thr 


leu 


asp 


cys 


arg ser 


gly 


asp 


val 


gly 


arg 


arg 


arg 


val 


183/61 


















213/71 














CGG TCA 


CCT 


GAC 


GGT 


CGG 


GAT 


GTT 


CCT 


TGG 


GTC TCG 


GGT 


TGC 


TGC 


TGG 


GTT 


TGC 


TCA 


ATG 


arg ser 


pro 


asp 


gly 


arg 


asp 


val 


pro 


trp 


val ser 


gly 


cys 


cys 


trp 


val 


cys 


ser 


met 


243/81 


















273/91 














CCC TGC 


TGG 


TGC 


GGC 


GTT 


CGG 


CCG 


AGT 


CGA 


TCA CCG 


CCA 


AAG 


AGC 


ACC 


CGT 


TAA 


AAC 


GGT 


pro cys 


trp 


cys 


gly 


val 


arg 


pro 


ser 


arg 


ser pro 


pro 


lys 


ser 


thr 


arg 


OCH 


asn 


gly 


303/101 


















333/111 














CGA TGG 


CCC 


TCA 


ACT 


CGG 


CAT 


CGC 


GAC 


TGG 


CGA TTA 


TCA 


CCA 


TGC 


CTC 


GGG 


CTG 


ATC 




arg trp 


pro 


ser 


thr 


arg 


his 


arg 


asp 


trp 


arg leu 


ser 


p ro 


cys 


leu 


gly 


leu 


ile 


















SEQ ID 


N° 11C 






























FIGURE 17C 


















partie de la sequence nucleotidique 


de seal7A 


















1/1 


















31/11 


















ggc tag 


aac 


CCC 


gaa 


gga 


gac 


etc 


gcg 


ggt 


tgc eg; 


eec 


ccg 


gec 


cat 


egg 


atg 


cgt 


ate 


gly AMB 


asn 


pro 


glu 


gly 


asp 


leu 


ala 


gly 


cys arg 


pro 


pro 


ala 


his 


a rq 


met 


arc 


ile 


61/21 


















91/31 














egg teg 


cgc 


cga 


ttc 


acg 


acc 


gac 


ata 


ggg 








ggt 


gat 


tec 


ggt 


gcg 


acg 


arg ser 


arg 


arg 


phe 


thr 


thr 


asp 


ile 


gly 


ser z y r 


pro 


leu 


gly 


asp 


ser 


gly 


ala 


thr 


121/41 


















151/51 












act gcg 


ata 


cgc 


teg 


gcg 


ggc 


cac 


cga 


tea 


gtc gat 


egg 


gtg; 


gtt 


tec 


get 


cca 


tea 


gec 


thr ala 


ile 


arg 


ser 


ala 


gly 


his 


arg 


ser 


val asp 


arg 


val 


val 


ser 


ala 


pro 


ser 


ala 


181/61 


















211/71 
















egg aat 


tga 


ggt 


gec 


gca 


gtg 


acg 


aca 


cca 


gcg cag 


gac 


gcg 


ccg 


ttg 


gtg 


ttt 


CCC 


tct 


arg asn 


OPA 


gly 


ala 


ala 


val 


thr 


thr 


pro 


ala gin 


asp 


ala 


pro 


leu 


val 


phe 


pro 


ser 


241/81 


















271/91 














gtt get 


ttc 


cgt 


ccg 


gtt 


cgc 


ctt 


ttt 


ttc 


ate aac 


gtt 


gga 


ctg 


gec 


gca 


gtg 


gcg 


atg 


val ala 


phe 


arg 


pro 


val 


arg 


leu 


phe 


phe 


ile asn 


va 1 


gly 


leu 


ala 


ala 


val 


ala 


met 


301/101 


















331/111 


















ttg gtc 


gec 


ggc 


gtg 


ttc 


ggt 


cac 


ctg 


acg 


gtc ggg 


atg 


ttc 


ttg 


ggt 


etc 


ggg 


ttg 


ctg 


leu val 


ala 


gly 


val 


phe 


gly 


his 


leu 


thr 


val gly 


r*".e t 


phe 


leu 


gly 


leu 


gly 


leu 


leu 


361/121 


















391/131 














ctg ggt 


ttg 


etc 


aat 


gec 


ctg 


ctg 


gtg 


egg 


cgt teg 


gee 


gag 


teg 


ate 


ace 


gec 


aaa 


gag 


leu gly 


leu 


leu 


asn 


ala 


leu 


leu 


val 


arg 


arg ser 


ala 


glu 


ser 


ile 


thr 


ala 


lys 


glu 


421/141 


















4 51/151 














cac ccg 


tta 


aaa 


egg 


teg 


atg 


gec 


etc 


aac 


teg gca 


teg 


cga 


ctg 


gcg 


att 


ate 


ace 


ate 


his pro 


leu 


lys 


arg 


ser 


met 


ala 


leu 


a s r. 


ser ala 




arg 


leu 


ala 


ile 


ile 




ile 



481/161 
etc ggg ctg ate 
leu gly leu lie 

SEQ ID N° 17A* 



FEUILLE DE REM^ESHIwE^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



60/185 



1/1 

get aga 
ala arg 
61/21 
ggt cgc 
gly arg 
121/41 
ctg cga 
leu arg 
181/61 
gga att 
gly ile 
241/81 
ttg ctt 
leu leu 
301/101 
tgg teg 
trp ser 
361/121 
tgg gtt 
trp val 
421/141 
acc cgt 
thr arg 
481/161 
teg ggc 
ser gly 



acc ccg 
thr pro 

gec gat 
ala asp 

tac get 
tyr ala 

gag gtg 
glu val 

tec gtc 
ser val 

ccg gcg 
pro ala 

tgc tea 
cys ser 

taa aac 
OCH asn 

tga tc 
OPA 



aag gag 
lys glu 

tea cga 
ser arg 

egg egg 
arg arg 

ccg cag 
pro gin 

egg ttc 
arg phe 



tgt 
cys 



teg 
ser 



atg ccc 
met pro 

ggt cga 
gly arg 



acc teg 
thr ser 

ccg aca 
pro thr 

gee acc 
ala thr 

tga cga 
OPA arg 

gec ttt 
ala phe 

gtc acc 
val thr 

tgc tgg 
cys trp 

tgg ccc 
trp pro 



egg gtt 
arg val 

tag gga 
AMB gly 

gat cag 
asp gin 

cac cag 
his gin 

ttt tea 
phe ser 

tga egg 
OPA arg 

tgc ggc 
cys gly 

tea act 
ser thr 



31/11 

gee ggc ccc 
ala gly pro 
91/31 

get acc cct 
ala thr pro 
151/51 
teg ate ggg 
3er ile gly 
211/71 
cgc agg acg 
arg arg thr 
271/91 
tea acg ttg 
ser thr leu 
331/111 
teg gga tgt 
ser gly cys 
391/131 
gtt egg ccg 
val arg pro 
451/151 

egg cat cgc gac tgg cga tta tea cca tec 
arg his arg asp trp arg leu ser pro ser 



egg ccc ate gga tgc gta tec 
arg pro ile gly cys val ser 

tgg gtg att ccg gtg cga cga 
trp val ile pro val arg arg 

tgg ttt ccg etc cat cag ccc 
trp phe pro leu his gin pro 

cgc cgt tgg tgt ttc cct ctg 
arg arg trp cys phe pro leu 

gac tgg ccg cag tgg cga tgt 
asp trp pro gin trp arg cys 

tct tgg gtc teg ggt tgc tgc 
ser trp val ser gly cys cys 

agt cga tea ccg cca aag age 
ser arg ser pro pro lys ser 



SEQ ID N° 17B' 



FIGURE 17B' 



1/1 

eta gaa ccc cga agg aga cct cgc ggg ttg 
leu glu pro arg arg arg pro arg gly leu 
61/21 

gtc gcg ccg att cac gac cga cat agg gag 
val ala pro ile his asp arg his arg glu 
121/41 

tgc gat acg etc ggc ggg cca ccg ate agt 
cys asp thr leu gly gly pro pro ile ser 
181/61 

gaa ttg agg tgc cgc agt gac gac acc age 
glu leu arg cys arg ser asp asp thr ser 
241/81 

tgc ttt ccg tec ggt teg cct ttt ttt cat 
cys phe pro ser gly ser pro one Dhe his 
301/101 

ggt cgc egg cgt gtt egg tea cct gac ggt 
gly arg arg arg val arg ser pro asn gly 
361/121 

ggg ttt get caa tgc cct get ggt gcg gcg 
gly phe ala gin cys pro ala gly ala ala 
421/141 

ccc gtt aaa acg gtc gat ggc cct caa etc 

pro val lys thr val asp gly oro gin leu 

431/161 

egg get gat c 

arg ala asp 



31/11 

ccg gec ccc ggc cca teg gat gcg tat ccg 

pro ala pro gly pro ser asp ala tyr pro 
91/31 

eta ccc ctt ggg tga ttc egg tgc gac gac 

leu pro leu gly OPA phe arg cys asp asp 
151/51 

cga teg ggt ggt ttc cgc tec ate age ccg 

arg ser gly gly phe arg ser ile ser pro 
211/71 

gca gga cgc gee gtt ggt gtt tec etc tgt 

ala gly arg ala val gly val ser leu cys 
271/91 

caa cgt tgg act ggc cgc agt ggc gat gtt 

gin arg trp thr gly arg ser gly asp val 
331/111 

egg gat gtt ctt ggg tct egg gtt get get 

arg asp val leu gly ser arg val ala ala 
391/131 

ttc ggc cga gtc gat cac cgc caa aga gca 

phe gly arg val aso his arg gin arg ala 
451/151 

ggc ate gcg act ggc gat tat cac cat cct 

gly ile ala thr gly asp tyr his his pro 



SEQ ID N° 17C 
FEUILLE DE RERftRLACSWIBN'E (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



61/185 

sequence Rvl303 predite par Cole et al . (Nature 393:537-544) et contenant partiellement 
Seql7A' 

1/1 31/11 

atg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct gtt get ttc cgt ccg gtt 
met thr thr pro ala gin asp ala pro leu val phe pro ser val ala phe arg pro val 
61/21 91/31 

cgc ctt ttt ttc ate aac gtt gga ctg gec gca gtg gcg atg ttg gtc gec ggc gtg ttc 
arg leu phe phe ile asn val gly leu ala ala val ala met leu val ala gly val phe 
121/41 151/51 

ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg ggt ttg etc aat gec 
gly his leu thr val gly met phe leu gly leu gly leu leu leu gly leu leu asn ala 
181/61 211/71 

ctg ctg gtg egg cgt teg gee gag teg ate ace gee aaa gag cac ccg tta aaa egg teg 
leu leu val arg arg ser ala glu ser ile thr ala lys glu his pro leu lys arq ser 
241/81 271/91 

atg gec etc aac teg gca teg cga ctg gcg att ate acc ate etc ggg ctg ate ate gec 
met ala leu asn ser ala ser arg leu ala ile ile thr ile leu gly leu ile ile ala 
301/101 331/111 

tac att ttc egg ccc get gga ttg ggc gtc gtg ttc ggg ctg gca ttc ttc cag gtg ctg 
tyr ile phe arg pro ala gly leu gly val val phe gly leu ala phe phe gin val leu 
361/121 391/131 

ctg gtg gca acg acg gee ctg ccg gtc ctg aag aag ctg cgc act gcg acc gag gaa ccg 
leu val ala thr thr ala leu pro val leu lys lys leu arg thr ala thr glu qlu pro 
421/141 451/151 

gtc gca act tat tct tec aat ggc cag acc ggg gga teg gaa gga agg age gee age gat 
val ala thr tyr ser ser asn gly gin thr gly gly ser glu gly arg ser ala ser asp 
481/161 
gac tga 
asp OPA 

SEQ ID N° 17D 
FIGURE 17D 

Orf d'apres Cole et al . (Nature 393:537-544) et contenant Rvl303 
1/1 31/11 

tga ggt gec gca gtg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct gtt get 
OPA gly ala ala val thr thr pro ala gin asp ala pro leu val phe pro ser val ala 
61/21 91/31 

ttc cgt ccg gtt cgc ctt ttt ttc ate aac gtt gga ctg gec gca gtg gcg atg ttg gtc 
phe arg pro val arg leu phe phe ile asn val gly leu ala ala val ala met leu val 
121/41 151/51 

gee ggc gtg ttc ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg ggt 
ala gly val phe gly his leu thr val gly met phe leu gly leu gly leu leu leu alv 
181/61 211/71 

ttg etc aat gec ctg ctg gtg egg cgt teg gee gag teg ate acc gec aaa gag cac ccg 
leu leu asn ala leu leu val arg arg ser ala glu ser ile thr ala lys glu his pro 
241/81 271/91 

tta aaa egg teg atg gec etc aac teg gca teg cga ctg gcg att ate acc ate etc ggg 
leu lys arg ser met ala leu asn ser ala ser arg leu ala ile ile thr ile leu gly 
301/101 331/111 

ctg ate ate gec tac att ttc egg ccc get gga ttg ggc gtc gtg ttc ggg ctg gca ttc 
leu lie lie ala tyr ile phe arg pro ala gly leu gly val val phe gly leu ala phe 
361/121 391/131 

ttc cag gtg ctg ctg gtg gca acg acg gec ctg ccg gtc ctg aag aag ctg cgc act gcg 
phe gin val leu leu val ala thr thr ala leu pro val leu lys lys leu arq thr ala 
421/141 451/151 

acc gag gaa ccg gtc gca act tat tct tec aat ggc cag acc ggg gga teg gaa gga agg 
thr glu glu pro val ala thr tyr ser ser asn gly gin thr gly gly ser qlu qlv arc 
431/161 

age gec age gat gac tga 
ser ala ser asp asp OPA 

SEQ ID N° 17F 



FEUILLE DE RERff4d(CayiBNT(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



62/185 

31/11 



GTC GAA 


CAG 


GTA 


CGG 


AAG 


GCG 


CCG 


TCG 


GTC 


GCT CGG 


TCC 


GCT 


GGT 


ATC 


TCG 


TGT 


TCA 


GCC 


val glu 


gin 


val 


arg 


lys 


ala 


pro 


ser 


val 


ala arg 


ser 


ala 


gly 


ile 


ser 


cys 


ser 


ala 


61/21 


















91/31 














AGC CAG 


CGG 


CCG 


TTA 


ACG 


TGG 


CCG 


AAC 


AGG 


TCG TCT 


TGG 


GGT 


CGG 


GCA 


TCA 


GCG 


TCG 


ATG 


ser gin 


arg 


pro 


leu 


thr 


trp 


pro 


asn 


arg 


ser ser 


trp 


gly 


arg 


ala 


ser 


ala 


ser 


me t 


121/41 


















151/51 












TGG CTC 


AGG 


TCG 


ATA 


CCC 


GAG 


GGG 


ATG 


GCA 


AGT GTC 


ACC 


CCG 


CCA 


TCC 


TTC 


CAC 


CTC 


TTT 


trp leu 


arg 


ser 


ile 


pro 


glu 


gly 


met 


ala 


ser val 


thr 


pro 


pro 


ser 


phe 


his 


leu 


phe 


181/61 


















211/71 












TCG GGT 


GCA 


ACG 


ATC 


GGG 


CCA 


TGC 


CTG 


ACG 


GGG AGC 


AGA 


GCC 


AGC 


CAC 


CGG 


CCC 


AAG 


AAG 


ser gly 


ala 


thr 


ile 


gly 


pro 


cys 


leu 


thr 


gly ser 


arg 


ala 


ser 


his 


arg 


pro 


lys 


lys 


241/81 


















271/91 










ATG CGG 


AAG 


ACG 


ACT 


CGC 


GGC 


CCG 


ACG 


CCG 


CGG AGG 


CCG 


CCG 


CGG 


CCG 


AAC 


CCA 


AAT 


CAT 


met arg 


lys 


thr 


thr 


arg 


gly pro 


thr 


pro 


arg arg 


pro 


pro 


arg 


pro 


asn 


pro 


asn 


his 


301/101 


















331/111 












CAG CCG 


GTC 


CCG 


ATG 


TTC 


TCG 


ACC 


TAC 


GGT 


ATC GCC 


TCG 


ACA 


CTA 


CTC 


GGC 


GTG 


CTA 


TCG 


gin pro 


val 


pro 


met 


phe 


ser 


thr 


tyr 


gly 


ile ala 


ser 


thr 


leu 


leu 


gly 


val 


leu 


ser 


361/121 


































GTC GCC 


GCG 


GTC 


GTG 


CTG 


GGT 


GCG 


ATG 


ATC 




















val ala 


ala 


val 


val 


leu 


gly 


ala 


met 


ile 





















SEQ ID N° 18A 
FIGURE 18A 





















32/11 


















TCG AAC 


AGG 


TAC 


GGA 


AGG 


CGC 


CGT 


CGG 


TCG 


CTC GGT 


CCG 


CTG 


GTA 


TCT 


CGT 


GTT 


CAG 


CCA 


ser asn 
62/21 


arg 


tyr 


gly 


arg 


arg 


arg 


arg 


ser 


leu gly 
92/31 


pro 


leu 


val 


ser 


arg 


val 


gin 


pro 


GCC AGC 


GGC 


CGT 


TAA 


CGT 


GGC 


CGA 


ACA 


GGT 


CGT CTT 


GGG 


GTC 


GGG 


CAT 


CAG 


CGT 


CGA 


TGT 


ala ser 
122/41 


gly 


arg 


OCH 


arg 


gly 


arg 


thr 


gly 


arg leu 
152/51 


gly 


val 


gly 


his 


gin 


arg 


arg 


cys 


GGC TCA 


GGT 


CGA 


TAC 


CCG 


AGG 


GGA 


TGG 


CAA 


GTG TCA 


CCC 


CGC 


CAT 


CCT 


TCC 


ACC 


TCT 


TTT 


gly ser 
182/61 


gly 


arg 


tyr 


pro 


arg 


gly 


trp 


gin 


val ser 
212/71 


pro 


arg 


his 


pro 


ser 


thr 


ser 


phe 


CGG GTG 


CAA 


CGA 


TCG 


GGC 


CAT 


GCC 


TGA 


CGG 


GGA GCA 


GAG 


CCA 


GCC 


ACC 


GGC 


CCA 


AGA 


AGA 


arg val 
242/81 


gin 


arg 


ser 


gly 


his 


ala 


CPA 


arg 


gly ala 
272/91 


glu 


pro 


ala 


thr 


gly 


pro 


arg 


arg 


TGC GGA 


AGA 


CGA 


CTC 


GCG 


GCC 


CGA 


CGC 


CGC 


GGA GGC 


CGC 


CGC 


GGC 


CGA 


ACC 


CAA 


ATC 


ATC 


cys gly 
302/101 


arg 


arg 


leu 


ala 


ala 


arg 


arg 


arg 


gly gly 
332/111 


arg 


arg 


g^y 


arg 


thr 


gin 


ile 


i i e 


AGC CGG 


TCC 


CGA 


TGT 


TCT 


CGA 


CCT 


ACG 


GTA 


TCG CCT 


CGA 


CAC 


TAC 


TCG 


GCG 


TGC 


TAT 


CGG 


ser arg 
362/121 


ser 


arg 


cys 


ser 


arg 


p ro 


thr 


val 


ser pro 


arg 


his 


tyr 


ser 


ala 


cys 


tyr 


arg 


TCG CCG 


CGG 


TCG 


TGC 


TGG 


GTG 


CGA 


TGA 


TC 




















ser pro 


arg 


ser 


cys 


trp 


val 


arg 


OPA 























SEQ ID N° 18B 

FIGURE 18B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



63/185 



3/1 


















33/11 


















CGA ACA 


GGT 


ACG 


GAA 


GGC 


GCC 


GTC 


GGT 


CGC 


TCG GTC 


CGC 


TGG 


TAT 


CTC 


GTG 


TTC 


AGC 


CAG 


arg thr 


gly 


thr 


glu 


gly 


ala 


val 


gly 


arg 


ser val 


arg 


trp 


tyr 


leu 


val 


phe 


ser 


aln 


63/21 


















93/31 












CCA GCG 


GCC 


GTT 


AAC 


GTG 


GCC 


GAA 


CAG 


GTC 


GTC TTG 


GGG 


TCG 


GGC 


ATC 


AGC 


GTC 


GAT 


GTG 


pro ala 


ala 


val 


asn 


val 


ala 


glu 


gin 


val 


val leu 


gly 


ser 


gly 


ile 


ser 


val 


asp 


val 


123/41 


















153/51 














GCT CAG 


GTC 


GAT 


ACC 


CGA 


GGG 


GAT 


GGC 


AAG 


TGT CAC 


CCC 


GCC 


ATC 


CTT 


CCA 


CCT 


CTT 


TTC 


ala gin 


val 


asp 


thr 


arg 


gly 


asp 


gly 


lys 


cys his 


pro 


ala 


ile 


leu 


pro 


pro 


leu 


phe 


183/61 


















213/71 












GGG TGC 


AAC 


GAT 


CGG 


GCC 


ATG 


CCT 


GAC 


GGG 


GAG CAG 


AGC 


CAG 


CCA 


CCG 


GCC 


CAA 


GAA 


GAT 


gly cys 


asn 


asp 


arg 


ala 


met 


pro 


asp 


gly 


glu gin 


ser 


gin 


pro 


pro 


ala 


gin 


glu 


asp 


243/81 


















273/91 










GCG GAA 


GAC 


GAC 


TCG 


CGG 


CCC 


GAC 


GCC 


GCG 


GAG GCC 


GCC 


GCG 


GCC 


GAA 


CCC 


AAA 


TCA 


TCA 


ala glu 


asp 


asp 


ser 


arg 


pro 


asp 


ala 


ala 


glu ala 


ala 


ala 


ala 


glu 


pro 


lys 


ser 


ser 


303/101 


















333/111 












GCC GGT 


CCC 


GAT 


GTT 


CTC 


GAC 


CTA 


CGG 


TAT 


CGC CTC 


GAC 


ACT 


ACT 


CGG 


CGT 


GCT 


ATC 


GGT 


ala gly 


pro 


asp 


val 


leu 


asp 


leu 


arg 


tyr 


arg leu 


asp 


thr 


thr 


arg 


arg 


ala 


ile 


gly 


363/121 






























CGC CGC 


GGT 


CGT 


GCT 


GGG 


TGC 


GAT 


GAT 


C 




















arg arg 


gly 


arg 


ala 


gly 


cys 


asp 


asp 























SEQ ID N° 18C 
FIGURE 18C 



partie de la sequence nucleotidique de seq!3A 
1/1 31/11 

GAA GGC GCC GTC GGT CGC TCG GTC CGC TGG TAT CTC GTG TTC AGC CAG CCA GCG GCC GTT 

glu gly ala val gly arg ser val arg trp tyr leu val phe ser gin pro ala ala val 
61/21 91/31 

AAC GTG GCC GAA CAG GTC GTC TTG GGG TCG GGC ATC AGC GTC GAT GTG GCT CAG GTC GAT 

asn val ala glu gin val val leu gly ser gly ile ser val asp val ala qln val asp 
121/41 151/51 

ACC CGA GGG GAT GGC AAG TGT CAC CCC GCC ATC CTT CCA CCT CTT TTC GGG TGC AAC GAT 

thr arg gly asp gly lys cys his pro ala ile leu pro pro leu phe gly cys asn aso 
181/61 211/71 

CGG GCC ATG CCT GAC GGG GAG CAG AGC CAG CCA CCG GCC CAA GAA GAT GCG GAA GAC GAC 

arg ala met pro asp gly glu gin ser gin pro oro ala gin alu aso ala glu aso aso 
241/81 271/91 ' * 

TCG CGG CCC GAC GCC GCG GAG GCC GCC GCG GCC GAA CCC AAA TCA TCA GCC GGT CCG ATG 

ser arg pro asp ala ala glu ala ala ala ala glu pro lvs ser ser ala gly pro met 
301/101 331/111 

TTC TCG ACC TAG GGT ATC GCC TCG ACA CTA CTC GGC GTG CTA TCG GTC GCC GCG GTC GTG 

phe ser thr tyr gly ile ala ser thr leu leu gly val leu ser val ala ala val val 
351/121 

CTG GGT GCG ATG ATC 
leu gly ala rr.et ile 



SEQ ID N° 18A' 
FIGURE 18A* 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



64/185 



1/1 

CGG AAG GCG CCG TCG GTC GCT 

arg lys ala pro ser val ala 
61/21 

TTA ACG TGG CCG AAC AGG TCG 

leu thr trp pro asn arg ser 
121/41 

ATA CCC GAG GGG ATG GCA AGT 

ile pro glu gly met ala ser 
181/61 

ATC GGG CCA TGC CTG ACG GGG 

ile gly pro cys leu thr gly 
241/81 

ACT CGC GGC CCG ACG CCG CGG 

thr arg gly pro thr pro arg 
301/101 

TGT TCT CGA CCT ACG GTA TCG 

cys ser arg pro thr val ser 
361/121 

TGC TGG GTG CGA TGA TC 

cys trp val arg OPA 









31/11 




CGG 


TCC 


GCT 


GGT ATC 


TCG 


arg 


ser 


ala 


gly ile 


ser 








91/31 




TCT 


TGG 


GGT 


CGG GCA 


TCA 


ser 


trp 


gly 


arg ala 


ser 








151/51 




GTC 


ACC 


CCG 


CCA TCC 


TTC 


val 


thr 


pro 


pro ser 


phe 








211/71 




AGC 


AGA 


GCC 


AGC CAC 


CGG 


ser 


arg 


ala 


ser his 


arg 








271/91 




AGG 


CCG 


CCG 


CGG CCG 


AAC 


arg 


pro 


pro 


arg pro 


asn 








331/111 




CCT 


CGA 


CAC 


TAC TCG 


GCG 


pro 


arg 


his 


tyr ser 


ala 



SEQ ID N° 18B' 
FIGURE 18B' 



TGT 


TCA 


GCC 


AGC 


CAG 


CGG 


CCG 


cys 


ser 


ala 


ser 


gin 


arg 


pro 


GCG 


TCG 


ATG 


TGG 


CTC 


AGG 


TCG 


ala 


ser 


met 


trp 


leu 


arg 


ser 


CAC 


CTC 


TTT 


TCG 


GGT 


GCA 


ACG 


his 


leu 


phe 


ser 


gly 


ala 


thr 


CCC 


AAG 


AAG 


ATG 


CGG 


AAG 


ACG 


pro 


lys 


lys 


met 


arg 


lys 


thr 


CCA 


AAT 


CAT 


CAG 


CCG 


GTC 


CGA 


pro 


asn 


his 


gin 


pro 


val 


arg 


TGC 


TAT 


CGG 


TCG 


CCG 


CGG 


TCG 


cys 


tyr 


arg 


ser 


pro 


arg 


ser 



1/1 

GGA AGG CGC CGT CGG TCG 
gly arg arg arg arg ser 
61/21 

TAA CGT GGC CGA ACA GGT 
OCH arg gly arg thr gly 
121/41 

TAC CCG AGG GGA TGG CAA 
tyr pro arg gly trp gin 
181/61 

TCG GGC CAT GCC TGA CGG 
ser gly his ala OPA arg 
241/81 

CTC GCG GCC CGA CGC CGC 
leu ala ala arg arg arg 
301/101 

GTT CTC GAC CTA CGG TAT 
val leu asp leu arg tyr 
361/121 

GCT GGG TGC GAT GAT C 
ala gly cys asp asp 











31/11 




CTC 


GGT 


CCG 


CTG 


GTA TCT 


CGT 


leu 


gly pro 


leu 


val ser 


arg 










91/31 




CGT 


CTT 


GGG 


GTC 


GGG CAT 


CAG 


arg 


leu 


gly 


val 


gly his 


gin 










151/51 




GTG 


TCA 


CCC 


CGC 


CAT CCT 


TCC 


val 


ser 


pro 


arg 


his pro 


ser 










211/71 




GGA 


GCA 


GAG 


CCA 


GCC ACC 


GGC 


gly 


ala 


glu 


pro 


ala thr 


gly 










271/91 




GGA 


GGC 


CGC 


CGC 


GGC CGA 


ACC 


gly 


gly 


arg 


arg 


gly arg 


thr 










331/111 




CGC 


CTC 


GAC 


ACT 


ACT CGG 


CGT 


arg 


leu 


asp 


thr 


thr arg 


arg 



GTT 


CAG 


CCA 


GCC 


AGC 


GGC 


CGT 


val 


gin 


pro 


ala 


ser 


gly 


arg 


CGT 


CGA 


TGT 


GGC 


TCA 


GGT 


CGA 


arg 


arg 


cys 


gly 


ser 


giy 


arg 


ACC 


TCT 


TTT 


CGG 


GTG 


CAA 


CGA 


thr 


ser 


phe 


arg 


val 


gin 


arg 


CCA 


AGA 


AGA 


TGC 


GGA 


AGA 


CGA 


pro 


arg 


a rg 


cys 


gly 


a rg 


a rg 


CAA 


ATC 


ATC 


AGC 


CGG 


TCC 


GAT 


gin 


lie 


ile 


ser 


arg 


ser 


asp 


GCT 


ATC 


GGT 


CGC 


CGC 


GGT 


CGT 


ala 


ile 


gly 


arg 


arg 


gly 


arg 



SEQ ID N° 18C 
FIGURE 18C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



65/185 



sequence Rv0199 predite par Cole et al. (Nature 393:537-544) et contenant 
seqlSA' 

1/1 31/11 

atg cct gac ggg gag cag age cag cca ccg gec caa gaa gat gcg gaa gac gac teg egg 

Met pro asp gly glu gin ser gin pro pro ala gin glu asp ala giu asp asD ser arq 
61/21 91/31 

ccc gac gee gcg gag gee gec gcg gee gaa ccc aaa tea tea gee ggt ccg atg ttc teg 

pro asp ala ala glu ala ala ala ala glu pro lys ser ser ala gly pro met phe ser 
121/41 151/51 

ace tac ggt ate gec teg aca eta etc ggc gtg eta teg gtc gee gcg gtc gtg ctg ggt 

thr tyr gly ile ala ser thr leu leu gly val leu ser val ala ala val val leu qlv 
181/61 211/71 

gcg atg ate tgg tec gca cac cgc gat gac tec ggc gag cgt acc tac ctg acc egg gtc 

ala met ile trp ser ala his arg asp asp ser gly glu arg thr tyr leu thr arq val 
241/81 271A91 

atg ctg acc gee get gaa tgg acg gee gtg ctg ate aac atg aac gee gac aac ate gat 

met leu thr ala ala glu trp thr ala val leu ile asn met asn ala asp asn ile asp 
301/101 331/111 

gee age ctg cag cga ctg cac gac gga acg gtc ggt caa etc aac acc gac ttc gac get 

ala ser leu gin arg leu his asp gly thr val gly gin leu asn thr asp phe asp ala 
361/121 391/131 

gtc gtg cag ccc tac egg cag gtg gtg gag aag ttg egg acg cac age age ggc agg ate 

val val gin pro tyr arg gin val val glu lys leu arg thr his ser ser gly arg ile 
421/141 451/151 

gag gcg gta gcg ate gat acg gtg cac cgc gag ctg gat acc cag tec ggt gee gee cga 

glu ala val ala ile asp thr val his arg glu leu asp thr gin ser gly ala ala arq 
481/161 . 511/171 9 

ccg gta gta acc acg aaa ttg cca ccg ttt gee act cgc acc gac teg gtg ctg ctg gtc 

pro val val thr thr lys leu pro pro phe ala thr arg thr asp ser val leu leu val 
541/181 571/191 

gcg acg teg gtc agt gag aac gec ggc gee aaa ccc cag acc gtg cac tgg aac ttg egg 

ala thr ser val ser glu asn ala gly ala lys pro gin thr val his trp asn leu arq 
601/201 631/211 

etc gat gtc tec gat gtg gac ggc aag ctg atg ate tec egg ttg gag teg att cga tga 

leu asp val ser asp val asp gly lys leu met ile ser arg leu glu ser lie arg OPA 



SEQ ID N° 18D 
FIGURE 18D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PO7FR98/01813 



66/185 



ORF d'apres Cole et al . (Nature 393:537-544) et contenant Rv0199 
1/1 31/11 

taa tec gat gec gga ttg ggt gaa atg cac caa gta acg ggt cga gtc ttt gga ate ggt 
OCH aer asp ala gly leu gly glu met his gin val thr gly arg val phe gly ile gly 
61/21 91/31 

ate gac ata gac tec gat gee gec gec cac gec ggc acg ttg cag agt gec aag ggc ggc 
ile asp ile asp ser asp ala ala ala his ala gly thr leu gin ser ala lys gly gly 
121/41 151/51 

ggc caa ttc ggt ggc gtc ggc cgc get gtc aat cgt ggc caa ttc gtc gtg cag egg ttg 
gly gin phe gly gly val gly arg ala val asn arg gly gin phe val val gin arg leu 
181/61 211/71 

cac ccc tgc gcg etc gac ggc ttc etc gtc gag gaa get ggc gta gag gtc gec gat gcg 
his pro cys ala leu asp gly phe leu val glu glu ala gly val glu val ala asp ala 
241/81 271/91 

ctg cgc ate ggt gec tac cgc age ace tgc ttg get ggc ctg gat gat cag gtc teg cac 
leu arg ile gly ala tyr arg ser thr cys leu ala gly leu asp asp gin val ser his 
301/101 331/111 

ttg tgt etc ggc gcg gtc gaa cag get acg gaa ggc gec gtc ggt cgc teg gtc cgc tgg 
leu cys leu gly ala val glu gin ala thr glu gly ala val gly arg ser val arg trp 
361/121 391/131 

tat etc gtg ttc age cag cca gcg gec gtt aac gtg gee gaa cag gtc gtc ttg ggg teg 
tyr leu val phe ser gin pro ala ala val asn val ala glu gin val val leu gly ser 
421/141 451/151 

ggc ate age gtc gat gtg get cag gtc gat ace cga ggg gat ggc aag tgt cac ccc gee 
gly ile ser val asp val ala gin val asp thr arg gly asp gly lys cys his pro ala 
481/161 511/171 

ate ctt cca cct ctt ttc ggg tgc aac gat egg gec atg cct gac ggg gag cag age cag 
ile leu pro pro leu phe gly cys asn a3p arg ala met pro asp gly glu gin ser gin 
541/181 571/191 

cca ccg gec caa gaa gat gcg gaa gac gac teg egg ccc gac gec gcg gag gec gec gcg 
pro pro ala gin glu asp ala glu asp asD ser arg pro asp ala ala glu ala ala ala 
601/201 631/211 

gec gaa ccc aaa tea tea gee ggt ccg atg ttc teg acc tac ggt ate gec teg aca eta 
ala glu pro lys ser ser ala gly pro met phe ser thr tyr gly ile ala ser thr leu 
661/221 691/231 

etc ggc gtg eta teg gtc gec gcg gtc gtg ctg ggt gcg atg ate tgg tec gca cac cgc 
leu gly val leu ser val ala ala val val leu gly ala met ile trp ser ala his arg 
721/241 751/251 

gat gac tec ggc gag cgt acc tac ctg acc egg gtc atg ctg acc gec get gaa tgg acg 
asp asp ser gly glu arg thr tyr leu thr arg val met leu thr ala ala glu trp thr 
791/261 811/271 

gec gtg ctg ate aac atg aac gee gac aac ate gat gee age ctg cag cga ctg cac gac 
ala val leu ile asn met asn ala asp asn ile asp ala ser leu gin arg leu his asp 
841/281 871/291 

gga acg gtc ggt caa etc aac acc gac ttc gac get gtc gtg cag ccc tac egg cag gtg 
gly thr val gly gin leu asn thr asp phe asp ala val val gin pro tyr arg gin val 
901/301 931/311 

gtg gag aag ttg egg acg cac age age ggc agg ate gag gcg gta gcg ate gat acg gtg 
val glu lys leu arg thr his ser ser gly arg ile glu ala val ala ile asD thr val 
961/321 991/331 

cac cgc gag ctg gat acc cag tec ggt gee gec cga ccg gta gta acc acg aaa ttg cca 
his arg glu leu asp thr gin ser gly ala ala arg pro val val thr thr lys leu pro 
1021/341 1051/351 

ccg ttt gec act cgc acc gac teg gtg ctg ctg gtc gcg acg teg gtc agt gag aac gec 
pro phe ala thr arg thr asp ser val leu leu val ala thr ser val ser glu asn ala 
1091/361 1111/371 

ggc gee aaa ccc cag acc gtg cac tgg aac ttg egg etc gat gtc tec gat gtg gac ggc 
gly ala lys pro gin thr val his trp asn leu arg leu aso val ser aso val asp gly 
1141/381 1171/391 
aag ctg atg ate tec egg ttg gag teg att cga tga 
lys leu met ile ser arg leu glu ser lie arg OPA 

SEQ ID N° 18F 



FIGURE 18F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



67/185 





















31/11 


















GTT GCG 


CAA 


CGG 


GGT 


GAG 


CAC 


CGA 


CGC 


GAT 


GAT GGC 


GCA 


ACT 


ATC 


GAlA 


APT 


rr n 




CAT 


val ala 


gin 


arg 


gly 


glu 


his 


arg 


arg 


asp 


asp qly 


ala 


thr 


ile 


glu 


thr 


ala 


gly 


his 


61/21 


















91/31 












CGC CAA 


CGC 


CAA 


CGA 


CGG 


CAC 


TCG 


CGC 


GGT 


GGG CAC 


CCC 


TGG 


CTA 




CCC 


par 




CGA 


arg gin 


arg 


gin 


arg 


arg 


his 


ser 


arg 


gly 


gly his 


pro 


trp 


leu 


ser 


y ± y 




a rg 


arg 


121/41 


















151/51 










CTA TGT 


GGT 


AAA 


CAC 


ACT 


GCG 


CAA 


CAG 


CGG 


111 1 \jr\ 






AAC 


CCC 


GGA 


GTT 


CTC 


CGC 


leu cys 


ql V 


1 vs 


hi s 


thr 


ala 


gin 


gin 


arg 


pile Ct\ 


cys 


a 1 r> 

a i a 


asn 


pro 


gly 


val 


leu 


arg 


181/61 


















211/71 












TCG CGT 


GTT 


CAA 


GGC 


CGA 


AAA 


AGG 


GGT 


GGT 


GAC CCT 


CGG 


CGG 


CAA 


CAC 


CGT 


GGA 


GGC 


GAG 


ser arg 


val 


gin 


gly 


arg 


lys 


arg 


gly 


gly 


asp pro 


arg 


arg 


gin 


his 


arg 


gly 


gly 


glu 


241/81 


















271/91 










GGC GCT 


CGA 


GTA 


CAG 


CCT 


CGG 


CAC 


ACC 


GCC 


GGA CGG 


GGT 


GAC 


GGG 


CCC 


GCT 


GGT 


GGC 


TGC 


gly ala 
301/101 


arg 


val 


gin 


pro 


arg 


his 


thr 


ala 


gly arg 
331/111 


gly 


asp 


gly 


pro 


ala 


gly 


gly 


cys 


CCC CGC 


CGA 


CGA 


CAG 


TCC 


GGG 


CTG 


CAG 


TCC 


GTC GGA 


CTA 


CGA 


CAG 


GCT 


GCC 


GGT 


GTC 


CGG 


pro arg 


arg 


arg 


gin 


ser 


gly 


leu 


gin 


ser 


val gly 


leu 


arg 


gin 


ala 


ala 


gly 


val 


arg 


361/121 


























TGC GGT 


GGT 


GCT 


GGT 


AGA 


TC 


























cys gly 


gly 


ala 


gly 


arg 





























SEQ ID N° 19A 
FIGURE 19A 



TTG CGC 


AAC 


GGG 


GTG 


AGC 


ACC 


GAC 


GCG 


leu arg 


asn 


.gly 


val 


ser 


thr 


asp 


ala 


62/21 














GCC AAC 


GCC 


AAC 


GAC 


GGC 


ACT 


CGC 


GCG 


ala asn 


ala 


asn 


asp 


gly 


thr 


arg 


ala 


122/41 
















TAT GTG 


GTA 


AAC 


ACA 


CTG 


CGC 


AAC 


AGC 


tyr val 


val 


asn 


thr 


leu 


arg 


asn 


ser 


182/61 














CGC GTG 


TTC 


AAG 


GCC 


GAA 


AAA 


GGG 


GTG 


arg val 


phe 


lys 


ala 


glu 


lys 


gly 


val 


242/81 
















GCG CTC 


GAG 


TAC 


AGC 


CTC 


GGC 


ACA 


CCG 


ala leu 


glu 


tyr 


ser 


leu 


gly 


thr 


pro 


302/101 














CCC GCC 


GAC 


GAC 


AGT 


CCG 


GGC 


TGC 


AGT 


pro ala 


asp 


asp 


ser 


pro 


gly 


cys 


ser 


362/121 














GCG GTG 


GTG 


CTG 


GTA 


GAT 


C 






ala val 


val 


leu 


val 


asp 











32/11 


















ATG 


ATG GCG 


CAA 


CTA 


TCG 


AAA 


CTG 


CAG 


GAC 


ATC 


met 


met aia 
92/31 


gin 


leu 


ser 


lys 


leu 


gin 


asp 


ile 


GTG 


GGC ACC 


CCT 


GGC 


TAT 


CAG 


GCC 


AGC 


GTC 


GAC 


val 


gly thr 
152/51 


pro 


gly 


tyr 


gin 


ala 


ser 


val 


asp 


GGT 


TTT GAT 


GTG 


CAA 


ACC 


CCG 


GAG 


TTC 


TCC 


GCT 


gly 


phe asp 
212/71* 


val 


gin 


thr 


pro 


glu 


phe 


ser 


aia 


GTG 


ACC CTC 


GGC 


GGC 


AAC 


ACC 


GTG 


GAG 


GCG 


AGG 


val 


thr leu 
272/91 


gly 


gly 


asn 


thr 


val 


glu 


aia 


arg 


CCG 


GAC GGG 


GTG 


ACG 


GGC 


CCG 


CTG 


GTG 


GCT 


GCC 


pro 


asp gly 
332/111 


val 


thr 


gly 


pro 


leu 


val 


ala 


ala 


CCG 


TCG GAC 


TAC 


GAC 


AGG 


CTG 


CCG 


GTG 




GGT 


pro 


ser asp 


tyr 


asp 


a rg 


leu 


pro 


va 1 


ser 


gly 



SEQ ID N° 19B 
FIGURE 19B 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



68/185 



33/11 



TGC GCA 


ACG 


GGG 


TGA 


GCA 


CCG 


ACG 


CGA 


TGA 


TGG CGC 


AAC 


TAT 


CGA 


AAC 


TGC 


AGG 


ACA 


TCG 


cys ala 


thr 


gly 


OPA 


ala 


pro 


thr 


arg 


OPA 


trp arg 


asn 


tyr 


arg 


asn 


cys 


arg 


thr 


ser 


63/21 


















93/31 










CCA ACG 


CCA 


ACG 


ACG 


GCA 


CTC 


GCG 


CGG 


TGG 


GCA CCC 


CTG 


GCT 


ATC 


AGG 


CCA 


GCG 


TCG 


ACT 


pro thr 


pro 


thr 


thr 


ala 


leu 


ala 


arg 


trp 


ala pro 


leu 


ala 


ile 


arg 


pro 


ala 


ser 


thr 


123/41 


















153/51 














ATG TGG 


TAA 


ACA 


CAC 


TGC 


GCA 


ACA 


GCG 


GTT 


TTG ATG 


TGC 


AAA 


CCC 


CGG 


AGT 


TCT 


CCC 




met trp 


OCH 


thr 


his 


cys 


ala 


thr 


ala 


val 


leu met 


cys 


lys 


pro 


arg 


ser 


ser 


pro 


leu 


183/61 


















213/71 










GCG TGT 


TCA 


AGG 


CCG 


AAA 


AAG 


GGG 


TGG 


TGA 


CCC TCG 


GCG 


GCA 


ACA 


CCG 


TGG 


AGG 


CGA 


GGG 


ala cys 


ser 


arg 


pro 


lys 


lys 


gly 


trp 


OPA 


pro ser 


ala 


ala 


thr 


pro 


trp 


arg 


arg 


gly 


243/81 


















273/91 










CGC TCG 


AGT 


ACA 


GCC 


TCG 


GCA 


CAC 


CGC 


CGG 


ACG GGG 


TGA 


CGG 


GCC 


CGC 


TGG 


TGG 


CTG 


CCC 


arg ser 


ser 


thr 


ala 


ser 


ala 


his 


arg 


arg 


thr gly 


OPA 


arg 


ala 


arg 


trp 


trp 


leu 


pro 


303/101 


















333/111 










CCG CCG 


ACG 


ACA 


GTC 


CGG 


GCT 


GCA 


GTC 


CGT 


CGG ACT 


ACG 


ACA 


GGC 


TGC 


CGG 


TGT 


CCG 


GTG 


pro pro 


thr 


thr 


val 


arg 


ala 


ala 


val 


arg 


arg thr 


thr 


thr 


gly 


cys 


arg 


cys 


pro 


val 


363/121 


























CGG TGG 


TGC 


TGG 


TAG 


ATC 




























arg trp 


cys 


trp 


AMB 


ile 










































SEQ ID 


N° 19C 






























FIGURE 19C 


















partie de la seauence nucleotidique 


de seql9A 


















1/1 


















31/11 


















CTA TCG 


AAA 


CTG 


CAG 


GAC 


ATC 


GCC 


AAC 


GCC 


A^C GAC 


GGC 


ACT 


CGC 


GCG 


GTG 


GGC 


ACC 


CCT 


leu ser 


lys 


leu 


gin 


asp 


ile 


ala 


asn 


ala 


asn asp 


gly 


thr 


a rg 


ala 


val 


q 1 v 


thr 


pro 


61/21 


















91/31 














GGC TAT 


CAG 


GCC 


AGC 


GTC 


GAC 


TAT 


GTG 


GTA 


AAC ACA 


CTG 


CGC 


AAC 


AGC 


GGT 


TTT 


GAT 


GTG 


gly tyr 


gin 


ala 


ser 


val 


asp 


tyr 


val 


val 


asn thr 


leu 


arg 


asn 


ser 


qly 


phe 


aso 


val 


121/41 


















151/51 














CAA ACC 


CCG 


GAG 


TTC 


TCC 


GCT 


CGC 


GTG 


TTC 


AAG GCC 


GAA 


AAA 


GGG 


GTG 


GTG 


ACC 


CTC 


GGC 


gin thr 


pro 


glu 


phe 


ser 


ala 


arg 


val 


phe 


lys ala 


glu 


lys 


gly 


val 


val 


thr 


leu 


gly 


181/61 


















211/71 














GGC AAC 


ACC 


GTG 


GAG 


GCG 


AGG 


GCG 


CTC 


GAG 


TAC AGC 


CTC 


GGC 


ACA 


CCG 


CCG 


GAC 


GGG 


GTG 


gly asn 


thr 


val 


glu 


ala 


arg 


ala 


leu 


glu 


tyr ser 


leu 


gly 


thr 


pro 


pro 


asp 


gly 


val 


241/81 


















271/91 










ACG GGC 


CCG 


CTG 


GTG 


GCT 


GCC 


CCC 


GCC 


GAC 


GAC AGT 


CCG 


GGC 


TGC 


AGT 


CCG 


TCG 


GAC 


TAC 


thr gly 


pro 


leu 


val 


ala 


ala 


pro 


ala 


asp 


asp ser 


pro 


gly 


cys 


ser 


p ro 


ser 


asp 


tyr 


301/101 


















331/111 
















GAC AGG 


CTG 


CCG 


GTG 


TCC 


GGT 


GCG 


GTG 


GTG 


CTG GTA 


GAT 


C 














asp arg 


leu 


pro 


val 


ser 


gly 


ala 


val 


val 


leu val 


asn 

















SEQ ID N° 19A' 
FIGURE 19A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



69/185 



1/1 

TAT CGA AAC TGC AGG ACA TCG 
tyr arg asn cys arg thr ser 
61/21 

GCT ATC AGG CCA GCG TCG ACT 
ala ile arg pro ala ser thr 
121/41 

AAA CCC CGG AGT TCT CCG CTC 
lys pro arg ser ser pro leu 
181/61 

GCA ACA CCG TGG AGG CGA GGG 
ala thr pro trp arg arg gly 
241/81 

CGG GCC CGC TGG TGG CTG CCC 
arg ala arg trp trp leu pro 
301/101 

ACA GGC TGC CGG TGT CCG GTG 
thr gly cys arg cys pro val 









31/11 




CCA 


ACG 


CCA 


ACG ACG 


GCA 


pro 


thr 


pro 


thr thr 


ala 








91/31 




ATG 


TGG 


TAA 


ACA CAC 


TGC 


met 


trp 


OCH 


thr his 


cys 








151/51 




GCG 


TGT 


TCA 


AGG CCG 


AAA 


ala 


cys 


ser 


arg pro 


lys 








211/71 




CGC 


TCG 


AGT 


ACA GCC 


TCG 


arg 


ser 


ser 


thr ala 


ser 








271/91 




CCG 


CCG 


ACG 


ACA GTC 


CGG 


pro 


pro 


thr 


thr val 


arg 








331/111 




CGG 


TGG 


TGC 


TGG TAG 


ATC 


arg 


trp 


cys 


trp AMB 


lie 



CTC GCG CGG TGG GCA CCC CTG 
leu ala arg trp ala pro leu 

GCA ACA GCG GTT TTG ATG TGC 
ala thr ala val leu met cys 

AAG GGG TGG TGA CCC TCG GCG 
lys gly trp OPA pro ser ala 

GCA CAC CGC CGG ACG GGG TGA 
ala his arg arg thr gly OPA 

GCT GCA GTC CGT CGG ACT ACG 
ala ala val arg arg thr thr 



SEQ ID N° 19B' 
FIGURE 19B f 



1/1 

ATC GAA ACT GCA GGA CAT CGC CAA CGC 
ile glu thr ala gly his arg gin arg 
61/21 

CTA TCA GGC CAG CGT CGA CTA TGT GGT 
leu ser gly gin arg arg leu cys glv 
121/41 

AAC CCC GGA GTT CTC CGC TCG CGT GTT 
asn pro gly val leu arg ser arg val 
181/61 

CAA CAC CGT GGA GGC GAG GGC GCT CGA 
gin his arg gly gly glu gly ala arg 
241/81 

GGG CCC GCT GGT GGC TGC CCC CGC CGA 
gly pro ala gly gly cys pro arg arg 
301/101 

CAG GCT GCC GGT GTC CGG TGC GGT GGT 
gin ala ala gly val arg cys gly gly 



31/11 



CAA 


CGA CGG 


CAC 


TCG 


CGC 


GGT 


GGG 


CAC 


CCC 


TGG 


gin 


arg arg 


his 


ser 


arg 


gly 


gly 


his 


pro 


trp 




91/31 














AAA 


CAC ACT 


GCG 


CAA 


CAG 


CGG 


TTT 


TGA 


TGT 


GCA 


lys 


his thr 


ala 


gin 


gin 


arg 


phe 


OPA 


cys 


ala 




151/51 














CAA 


GGC CGA 


AAA 


AGG 


GGT 


GGT 


GAC 


CCT 


CGG 


CGG 


gin 


gly arg 


lys 


arg 


gly 


gly 


asp 


pro 


arg 


arg 




211/71 










GTA 


CAG CCT 


CGG 


CAC 


ACC 


GCC 


GGA 


CGG 


GGT 


GAC 


val 


gin pro 


arg 


his 


thr 


ala 


gly 


a rg 


gly 


asp 




271/91 
















CGA 


CAG TCC 


GGG 


CTG 


CAG 


TCC 


GTC 


GGA 


CTA 


CGA 


arg 


gin ser 


gly 


leu 


gin 


ser 


val 


gly 


leu 


arg 



331/111 



GCT GGT AGA TC 
ala gly arg 



SEQ ID N° 19C 
FIGURE 19C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



POYFR98/01813 



70/185 



sequence Rv0418 predite par Cole et al . (Nature 393:537-544} et contenant 
seql9A' 



1/1 

atg gtg aac aaa 

Met val asn lys 
61/21 

ctg acg acg ggc 

leu thr thr gly 
121/41 

gcc gca gag ttc 

ala ala glu phe 
181/61 

eta teg aaa ctg 

leu ser lys leu 
241/81 

ggc tat cag gcc 

gly tyr gin ala 
301/101 

caa acc ccg gag 

gin thr pro glu 
361/121 

ggc aac acc gtg 

gly asn thr val 
421/141 

acg ggc ccg ctg 

thr gly pro leu 
481/161 

gac agg ctg ccg 

asp arg leu pro 
541/181 

cag aag gaa gac 

gin lys glu asp 
601/201 

gac gag cag gcg 

asp glu gin ala 
661/221 

agt gtc acc aag 

ser val thr lys 
721/241 

etc acg gcg age 

leu thr ala ser 
781/261 

teg teg gcc aac 

ser ser ala asn 
841/281 

ate aac gac aac 

ile asn asp asn 
901/301 

tea ccg cat gtg 

ser pro his val 
961/321 

att ggg tea cga 

ile gly ser arg 



tec agg atg atg 
ser arg met met 

tgt ate egg tgg 
cys ile arg trp 

gcc gtt gcg ttg 
ala val ala leu 

cag gac ate gcc 
gin asp ile ala 

age gtc gac tat 
ser val asp tyr 

ttc tec get cgc 
phe ser ala arg 

gag gcg agg gcg 
glu ala arg ala 

gtg get gcc ccc 
val ala ala pro 

gtg tec ggt gcg 
val ser gly ala 

gca gcc gcg cag 
ala ala ala gin 

atg ggc ggc acc 
met gly gly thr 

teg gtc gga ttc 
ser val gly phe 

acc caa agt ttc 
thr gin ser phe 

gtg gtg atg gca 
val val met ala 

ggc teg gga gtg 
gly ser gly val 

tec aac gcg gta 
ser asn ala val 

aac tac gtc gag 
asn tyr val glu 







31/11 


ccg 


gcg 


gtg ctg 


pro 


ala 


val leu 






91/31 


tct 


acg 


cag teg 


ser 


thr 


gin ser 






151/51 


cgc 


aac 


egg gtg 


arg 


asn 


arg val 






211/71 


aac 


gcc 


aac gac 


asn 


ala 


asn asp 






271/91 


gtg 


gta 


aac aca 


val 


val 


asn thr 






331/111 


gtg 


ttc 


aag gcc 


val 


phe 


lys ala 






391/131 


etc 


gag 


tac age 


leu 


glu 


tyr ser 






451/151 


gcc 


gac 


gac agt 


ala 


asp 


asp ser 






511/171 


gtg 


gtg 


ctg gta 


val 


val 


leu val 






571/191 


cgc 


ggt 


gcg gtg 


arg 


gly 


ala val 






631/211 


ctg 


ggg 


get aat 


leu 


gly 


ala asn 






691/231 


cag 


eta 


cgc gga 


gin 


leu 


arg gly 






751/251 


aag 


gcc 


cgc aac 


lys 


ala 


arg asn 






811/271 


ggt 


gcg 


cat ttg 


gly 


ala 


his leu 






871/291 


get 


gcg 


gtt ctg 


ala 


ala 


val leu 






931/311 


egg 


ttc 


gcc ttc 


arg 


phe 


ala phe 






991/331 


teg 


ctg 


gac ate 


ser 


leu 


asp lie 



gcc gtg get gtg 
ala val ala val 

egg ccc gtt gtt 
arg pro val val 

age acc gac gcg 
ser thr asp ala 

ggc act cgc gcg 
gly thr arg ala 

ctg cgc aac age 
leu arg asn ser 

gaa aaa ggg gtg 
glu lys gly val 

etc ggc aca ccg 
leu gly thr pro 

ccg ggc tgc agt 
pro gly cys ser 

gat cgc ggc gtc 
asp arg gly val 

gcg ctg ate att 
ala leu ile ile 

acc gac gtc aag 
thr asp val lys 

cag tct ggg cca 
gin ser gly pro 

gtc ate gcg cag 
val ile ala gin 

gac age gtt ccg 
asp ser val pro 

gaa acg gca gtg 
glu thr ala val 

tgg ggc gcc gag 
trp gly ala glu 

gac gcg etc aaa 
asp ala leu lys 



gtc gtc gca ttc 
val val ala phe 

aac ggc ccc get 
asn gly pro ala 

atg atg gcg cac 
met met ala his 

gtg ggc acc cct 
val gly thr pro 

ggt ttt gat gtg 
gly phe asp val 

gtg acc etc ggc 
val thr leu gly 

ccg gac ggg gtg 
pro asp gly val 

ccg teg gac tac 
pro ser asp tyr 

tgt cct ttt gcc 
cys pro phe ala 

get gac aac ate 
ala asp asn ile 

ate ccg gtg gtg 
ile pro val val 

acc acc gtc aag 
thr thr val lys 

acg aag acg ggg 
thr lys thr gly 

gaa gga ccc ggc 
glu gly pro gly 

cag ctg ggg aac 
gin leu gly asn 

gaa ttc ggc ctg 
glu phe gly leu 

ggc ate gcg ctg 
gly ile ala leu 



SEQ ID N° 19 D 



FIGURE 19D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



71/185 



1021/341 
















1051/351 
















tat ctg aac 
tyr leu asn 
1081/361 


ttc 
phe 


gac 
asp 


atg 
met 


ttg 
leu 


gcg 
ala 


teg 
ser 


ccg 
pro 


aac ccg ggt 
asn pro gly 
1111/371 


tac 
tyr 


ttc 
phe 


acc 
thr 


tac 
tyr 


gac 
asp 


ggt 
gly 


gac 
asp 


cag teg ctg 
gin ser leu 
1141/381 


ccg 
pro 


eta 
leu 


gac 
asp 


gec 
ala 


cgc 
arg 


ggt 
gly 


cag 
gin 


ccg gtg gtg 
pro val val 
1171/391 


ccc 
pro 


gaa 
glu 


ggc 
gly 


teg 
ser 


gee 
ala 


ggt 
gly 


ate 

ile 


gag cgc acg 
glu arg thr 
1201/401 


ttc 
phe 


gtc 
val 


gec 
ala 


tat 
tyr 


ctg 
leu 


aag 
lys 


atg 

met 


gee ggc aag 
ala gly lys 
1231/411 


acc 
thr 


gcg 
ala 


cag 
gin 


gac 
asp 


acc 
thr 


teg 
ser 


ttc 
phe 


gac ggt egg 
asp gly arg 
1261/421 


tec 
ser 


gac 
asp 


tac 
tyr 


gac 
asp 


ggc 
gly 


ttc 
phe 


acg 
thr 


ctg gcg ggt 
leu ala gly 
1291/431 


ate 
ile 


cct 
pro 


teg 
ser 


ggt 
gly 


ggc 
gly 


ctg 

leu 


ttc 
phe 


tec ggc get 
ser gly ala 
1321/441 


gag 
glu 


gtc 
val 


aag 
lys 


aag 

lys 


tec 
ser 


gee 
ala 


gag 

glu 


caa gec gag 
gin ala glu 
1351/451 


etc 
leu 


tgg 
trp 


ggc 
gly 


ggc 
gly 


acc 
thr 


gee 
ala 


gac 
asp 


gag cct ttc 
glu pro phe 
1381/461 


gat 

asp 


ccc 
pro 


aac 
asn 


tat 
tyr 


cac 
his 


cag 
gin 


aag 
lys 


aca gac acc 
thr asp thr 
1411/471 


ctg 
leu 


gac 
asp 


cat 
his 


ate 
ile 


gac 
asp 


cgc 
arg 


acc 
thr 


gcg etc ggt 
ala leu gly 
1441/481 


ate 
ile 


aac 
asn 


ggc 
gly 


get 
ala 


ggc 
gly 


gtc 
val 


gcg 
ala 


tac gcg gtg 
tyr ala val 
1471/491 


ggt 
gly 


ttg 
leu 


tat 
tyr 


gcg 
ala 


cag 
gin 


gac 
asp 


etc 
leu 


ggc ggc ccc 
gly gly pro 
1501/501 


aac 
asn 


ggg 

gly 


gtt 
val 


ccg 
pro 


gtc 
val 


atg 
met 


gcg 
ala 


gac cgc acc 
asp arg thr 


cgc 
arg 


cac 
his 


ctg 
leu 


att 
ile 


gec 
ala 


aaa 
lys 


ccg 
pro 



tga 
OPA 



SEQ ID N° 19D (suite) 
FIGURE 19D (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



72/185 



ORF d'apres Cole et al . (Nature 393:537-544) et contenant Rv0418 



1/1 

tag gcc 
AMB ala 
61/21 
cag gcg 
gin ala 
121/41 
gcc gtg 
ala val 
181/61 
egg ccc 
arg pro 
241/81 
age acc 
ser thr 
301/101 
ggc act 
gly thr 
361/121 
ctg cgc 
leu arg 
421/141 
gaa aaa 
glu lys 
481/161 
etc ggc 
leu gly 
541/181 
ccg ggc 
pro gly 
601/201 
gat cgc 
asp arg 
661/221 
gcg ctg 
ala leu 
721/241 
acc gac 
thr asp 
781/261 
cag tct 
gin ser 
341/281 
gtc ate 
val ile 
901/301 
gac age 
asp ser 
961/321 
gaa acg 
glu thr 



att caa 
ile gin 

egg tct 
arg ser 

get gtg 
ala val 

gtt gtt 
val val 

gac gcg 
asp ala 

cgc gcg 
arg ala 

aac age 
asn ser 

ggg gtg 
gly val 

aca ccg 
thr pro 

tgc agt 
cys ser 

ggc gtc 
gly val 

ate att 
ile ile 

gtc aag 
val lys 

ggg cca 
gly pro 

gcg cag 
ala gin 

gtt ccg 
val pro 

gca gtg 
ala val 



cgc 
arg 

aat 
asn 

gtc 
val 

aac 
asn 

atg 
met 

gtg 
val 

ggt 
gly 

gtg 
val 

ccg 
pro 

ccg 
pro 

tgt 
cys 

get 
ala 

ate 
ile 

acc 
thr 

acg 
thr 

gaa 
glu 

cag 
gin 



tct 
ser 

ctg 
leu 

gtc 
val 

ggc 
gly 

atg 
met 

ggc 
gly 

ttt 
phe 

acc 
thr 

gac 
asp 

teg 
ser 

cct 
pro 

gac 
asp 

ccg 
pro 

acc 
thr 

aag 
lys 

gga 
gly 

ctg 
leu 



gtt 
val 

ggc 
gly 

gca 
ala 

ccc 
pro 

gcg 
ala 

acc 
thr 

gat 
asp 

etc 
leu 

ggg 

gly 

gac 
asp 

ttt 
phe 

aac 

asn 

gtg 
val 

gtc 
val 

acg 
thr 

ccc 
pro 

ggg 

gly 



cgt ttg att 
arg leu ile 

gcg atg gtg 
ala met val 

ttc ctg acg 
phe leu thr 

get gcc gca 
ala ala ala 

cac eta teg 
his leu ser 

cct ggc tat 
pro gly tyr 

gtg caa acc 
val gin thr 

ggc ggc aac 
gly gly asn 

gtg acg ggc 
val thr gly 

tac gac agg 
tyr asp arg 

gcc cag aag 
ala gin lys 

ate gac gag 
ile asp giu 

gtg agt gtc 
val ser val 

aag etc acg 
lys leu thr 

ggg teg teg 
gly ser ser 

ggc ate aac 
gly ile asn 

aac tea ccg 
asn ser oro 



31/11 
ggt egg 
gly arg 
91/31 
aac aaa 
asn lys 
151/51 
acg ggc 
thr gly 
211/71 
gag ttc 
glu phe 
271/91 
aaa ctg 
lys leu 
331/111 
cag gcc 
gin ala 
391/131 
ccg gag 
pro glu 
451/151 
acc gtg 
thr val 
511/171 
ccg ctg 
pro leu 
571/191 
ctg ccg 
leu pro 
631/211 
gaa gac 
glu asp 
691/231 
cag gcg 
gin ala 
751/251 
acc aag 
thr lys 
811/271 
gcg age 
ala ser 
371/291 
gcc aac 
ala asn 
931/311 
gac aac 
asp asn 
991/331 
cat gtg 
his val 



tgg gat 
trp asp 

tec agg 
ser arg 

tgt ate 
cys ile 

gcc gtt 
ala val 

cag gac 
gin asp 

age gtc 
ser val 

ttc tec 
phe ser 

gag gcg 
glu ala 

gtg get 
val ala 

gtg tec 
val ser 

gca gcc 
ala ala 

atg ggc 

met gly 

teg gtc 
ser val 

acc caa 
thr gin 

gtg gtg 

val val 

ggc teg 
gly ser 

tec aac 
ser asn 



gcg aaa 
ala lys 

atg atg 
met met 

egg tgg 
arg trp 

gcg ttg 
ala leu 

ate gcc 
ile ala 

gac tat 
asp tyr 

get cgc 
ala arg 

agg gcg 
arg ala 

gcc ccc 
ala pro 

ggt gcg 
gly ala 

gcg cag 
ala gin 

ggc acc 
gly thr 

gga ttc 
gly phe 

agt ttc 
ser phe 

atg gca 
met ala 

gga gtg 
gly val 

gcg gta 
ala val 



get gcg 
ala ala 

ccg gcg 
pro ala 

tct acg 
ser thr 

cgc aac 
arg asn 

aac gcc 
asn ala 

gtg gta 
val val 

gtg ttc 
val phe 

etc gag 
leu glu 

gcc gac 
ala asp 

gtg gtg 
val val 

cgc ggt 
arg gly 

ctg ggg 
leu gly 

cag eta 
gin leu 

aag gcc 
lys ala 

ggt gcg 
gly ala 

get gcg 
ala ala 

egg ttc 
arg phe 



egg cga 
arg arg 

gtg ctg 
val leu 

cag teg 
gin ser 

egg gtg 
arg val 

aac gac 
asn asp 

aac aca 
asn thr 

aag gcc 
lys ala 

tac age 
tyr ser 

gac agt 
asp ser 

ctg gta 
leu val 

gcg gtg 
ala val 

get aat 
ala asn 

cgc gga 
arg gly 

cgc aac 
arg asn 

cat ttg 
his leu 

gtt ctg 
val leu 

gcc :t: 
ala one 



SEQ ID N° 19 F 



FIGURE 19F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



73/185 



1021/341 
















1051/351 
















tgg ggc gcc 
trp gly ala 
1081/361 


gag 
glu 


gaa 
glu 


ttc 
phe 


ggc 
gly 


ctg 
leu 


att 
ile 


ggg 

gly 


tea cga aac 
ser arg asn 
1111/371 


tac 
tyr 


gtc 
val 


gag 
glu 


teg 
ser 


ctg 
leu 


gac 
asp 


ate 
ile 


gac gcg etc 
asp ala leu 
1141/381 


aaa 
lys 


ggc 
gly 


ate 
ile 


gcg 
ala 


ctg 
leu 


tat 
tyr 


ctg 
leu 


aac ttc gac 
asn phe asp 
1171/391 


atg 
met 


ttg 
leu 


gcg 
ala 


teg 
ser 


ccg 
pro 


aac 
asn 


ccg 
pro 


ggt tac ttc 
gly tyr phe 
1201/401 


acc 
thr 


tac 
tyr 


gac 
asp 


ggt 
gly 


gac 
asp 


cag 
gin 


teg 
ser 


ctg ccg eta 
leu pro leu 
1231/411 


gac 
asp 


gcc 
ala 


cgc 
arg 


ggt 
gly 


cag 
gin 


ccg 
pro 


gtg 
val 


gtg ccc gaa 
val pro glu 
1261/421 


ggc 
gly 


teg 
ser 


gcc 
ala 


ggt 
gly 


ate 
ile 


gag 
glu 


cgc 
arg 


acg ttc gtc 
thr phe val 
1291/431 


gcc 
ala 


tat 
tyr 


ctg 
leu 


aag 
lys 


atg 
met 


gcc 
ala 


ggc 
gly 


aag acc gcg 
lys thr ala 
1321/441 


cag 
gin 


gac 
asp 


acc 
thr 


teg 
ser 


ttc 
phe 


gac 
asp 


ggt 
gly 


egg tec gac 
arg ser asp 
1351/451 


tac 
tyr 


gac 
asp 


ggc ttc 
gly phe 


acg 
thr 


ctg 
leu 


gcg 
ala 


ggt ate cct 
gly ile pro 
1381/461 


teg 
ser 


ggt 
gly 


ggc 
gly 


ctg 
leu 


ttc 
phe 


tec 
ser 


ggc 
gly 


get gag gtc 
ala glu val 
1411/471 


aag 
lys 


aag 
lys 


tec 
ser 


gcc 
ala 


gag 
glu 


caa 
gin 


gcc 
ala 


gag etc tgg 
glu leu trp 
1441/481 


ggc 
gly 


ggc 
gly 


acc 
thr 


gcc 
ala 


gac 
asp 


gag 
glu 


cct 
pro 


ttc gat ccc 
phe asp pro 
1471/491 


aac 
asn 


tat 
tyr 


cac 
his 


cag 
gin 


aag 
lys 


aca 
thr 


gac 
asp 


acc ctg gac 
thr leu asp 
1501/501 


cat 
his 


ate 
ile 


gac 
asp 


cgc 
arg 


acc 
thr 


gcg 
ala 


etc 
leu 


ggt ate aac 
gly ile asn 
1531/511 


ggc 
gly 


get 
ala 


ggc 
gly 


gtc 
val 


gcg 
ala 


tac 
tyr 


gcg 
ala 


gtg ggt ttg 
val gly leu 
1561/521 


tat 
tyr 


gcg 
ala 


cag 
gin 


gac 
asp 


etc 
leu 


ggc 
gly 


ggc 
gly 


ccc aac ggg 
pro asn gly 


gtt 
val 


ccg 
pro 


gtc 
val 


atg 
met 


gcg 
ala 


gac 
asp 


cgc 
arg 


acc cgc cac 
thr arg his 


ctg 
leu 


att 
ile 


gcc 
ala 


aaa 
lys 


ccg 
pro 


tga 
OPA 





















SEQ ID N° 19F (suite) 



FIGURE 19F (suite) 



31/11 

CGA GAC AGT GGT GCG GGA CAC TTG AGT TCG GCT GCT AAC GAC GCC AGA GTC GCC CGC TTC 
arg asp ser gly ala gly his leu ser ser ala ala asn asp ala arg val ala arg phe 
61/21 91/31 

CGC GGT GTG GGA CTC ACG TTC GGT GAG GGT ACA GCG GAC CTT CGA GCA CGC AAT ATC GTG 
arg gly val gly leu thr phe gly glu gly thr ala asp leu arg ala arg asn ile val 
121/41 151/51 

GGC CGG CTG GCA ACC GTC GGT TTC GAC GTT GGT GAC GAC CCC TCG TTC ATG AAT CGT TCT 
gly arg leu ala thr val gly phe asp val gly asp asp pro ser phe met asn arg ser 
181/61 ' 211/71 

TGA GCT CCC CGT TTT GCT GGA TGC CCA GGC ACC GCC GGT ACT GCT GCG CTT AAG CTT GTC 
OPA ala pro arg phe ala gly cys pro gly thr ala gly thr ala ala leu lys leu val 
241/81 * 271/91 

GCA CAT GGT GCC GGC AGG GAG GAA CAG TGG GCA AGC AGC TAG CCG CGC TCG CCG CGC TGG 
ala his gly ala gly arg glu glu gin trp ala ser ser AMB pro arg ser pro arg trp 
301/101 ' 331/111 

TCG GTG CGT GCA TGC TCG CAG CCG GAT GCA CCA ACG TGG TCG ACG GGA CCG CCG TGG CTG 
ser val arg ala cys ser gin pro asp ala pro thr trp ser thr gly pro pro trp leu 
361/121 

CCG ACA AAT CCG GAC CAC TGC ATC AGG ATC 
pro thr asn pro asp his cys lie arg ile 



SEQ ID N° 20A 
FEU1LLE DE REM ^^||^ E ^ REGLE 26 ) 



WO 99/09186 



PCT7FR98/01813 



74/185 



GAG ACA 


GTG 


GTG 


CGG 


GAC 


ACT 


glu thr 


val 


val 


arg 


asp 


thr 


62/21 










GCG GTG 


TGG 


GAC 


TCA 


CGT 


TCG 


ala val 


trp 


asp 


ser 


arg 


ser 


122/41 












GCC GGC 


TGG 


CAA 


CCG 


TCG 


GTT 


ala gly 


trp 


gin 


pro 


ser 


val 


182/61 












GAG CTC 


CCC 


GTT 


TTG 


CTG 


GAT 


glu leu 


pro 


val 


leu 


leu 


asp 


242/81 












CAC ATG 


GTG 


CCG 


GCA 


GGG 


AGG 


his met 


val 


pro 


ala 


gly 


arg 


302/101 












CGG TGC 


GTG 


CAT 


GCT 


CGC 


AGC 


arg cys 


val 


his 


ala 


arg 


ser 


362/121 












CGA CAA 


ATC 


CGG 


ACC 


ACT 


GCA 


arg gin 


ile 


arg 


thr 


thr 


ala 









32/11 






TGA 


GTT 


CGG 


CTG CTA 


ACG 


ACG 


OPA 


val 


arg 


leu leu 


thr 


thr 








92/31 






GTG 


AGG 


GTA 


CAG CGG 


ACC 


TTC 


val 


arg 


val 


gin arg 


thr 


phe 








152/51 






TCG 


ACG 


TTG 


GTG ACG 


ACC 


CCT 


ser 


thr 


leu 


val thr 


thr 


pro 








212/71 






GCC 


CAG 


GCA 


CCG CCG 


GTA 


CTG 


ala 


gin 


ala 


pro pro 


val 


leu 








272/91 






AAC 


AGT 


GGG 


CAA GCA 


GCT 


AGC 


asn 


ser 


gly 


gin ala 


ala 


ser 








332/111 






CGG 


ATG 


CAC 


CAA CGT 


GGT 


CGA 


arg 


met 


his 


gin arg 


gly 


arg 


TCA 


GGA 


TC 








ser 


gly 











SEQ ID N° 20B 
FIGURE 20B 



CCA GAG TCG CCC GCT TCC 
pro glu ser pro ala ser 

GAG CAC GCA ATA TCG TGG 
glu his ala ile ser trp 

CGT TCA TGA ATC GTT CTT 
arg ser OPA ile val leu 

CTG CGC TTA AGC TTG TCG 
leu arg leu ser leu ser 

CGC GCT CGC CGC GCT GGT 
arg ala arg arg ala gly 

CGG GAC CGC CGT GGC TGC 
arg asp arg arg gly cys 



AGA CAG TGG TGC GGG 
arg gin trp cys gly 
63/21 

CGG TGT GGG ACT CAC 
arg cys gly thr his 
123/41 

CCG GCT GGC AAC CGT 
pro ala gly asn arg 
183/61 

AGC TCC CCG TTT TGC 
ser ser pro phe cys 
243/81 

ACA TGG TGC CGG CAG 
thr trp cvs arg gin 
303/101 

GGT GCG TGC ATG CTC 
gly ala cys met leu 
363/121 

GAC AAA. TCC GGA CCA 
asp lys ser gly pro 



ACA 


CTT 


GAG 


TTC 


GGC 


thr 


leu 


glu 


phe 


gly 


GTT 


CGG 


TGA 


GGG 


TAC 


val 


a^g 


OPA 


gly 


tyr 


CGG 


TTT 


CGA 


CGT 


TGG 


arg 


phe 


arg 


arg 


trp 


TGG 


ATG 


CCC 


AGG 


CAC 


trp 


met 


pro 


arg 


his 


GGA 


GGA 


ACA 


GTG 


GGC 


gly 


gly 


thr 


val 


gly 


GCA 


GCC 


GGA 


TGC 


ACC 


ala 


ala 


gly 


cys 


thr 


CTG 


CAT 


CAG 


GAT 


C 


leu 


his 


gin 


asp 





33/11 

TGC TAA CGA CGC CAG 
cys OCH arg arg gin 
93/31 

AGC GGA CCT TCG AGC 
ser gly pro ser ser 
153/51 

TGA CGA CCC CTC GTT 
OPA arg pro leu val 
213/71 

CGC CGG TAC TGC TGC 
arg arg tyr cys cys 
273/91 

AAG CAG CTA GCC GCG 
lys gin leu ala ala 
333/111 

AAC GTG GTC GAC GGG 
asn val val asp gly 



AGT CGC CCG CTT CCG 
ser arg pro leu pro 

ACG CAA TAT CGT GGG 
thr gin tyr arg gly 

CAT GAA TCG TTC TTG 
his glu ser phe leu 

GCT TAA GCT TGT CGC 
ala OCH ala cys arg 

CTC GCC GCG CTG GTC 
leu ala ala leu val 

ACC GCC GTG GCT GCC 
thr ala val ala ala 



SEQ ID N° 20C 
FEUILLE DE REMPtfi^E^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



75/185 



partie de la sequence nucleotidique de seq20A 



1/1 


















31/11 


















TGT GGG 


ACT 


CAC 


GTT 


CGG 


TGA 


GGG 


TAC 


AGC 


GGA CCT 


TCG 


AGC 


ACG 


CAA 


TAT 


CGT 


GGG 


CCG 


cys gly 


thr 


his 


val 


arg 


OPA 


gly 


tyr 


ser 


gly pro 


ser 


ser 


thr 


gin 


tyr 


arg 


ql V 


pro 


61/21 


















91/31 








GCT GGC 


AAC 


CGT 


CGG 


TTT 


CGA 


CGT 


TGG 


TGA 


CGA CCC 


CTC 


GTT 


CAT 


GAA 


TCG 


TTC 


TTr; 

1 lu 




ala gly 


asn 


arg 


arg 


phe 


arg 


arg 


trp 


OPA 


arq Dro 


1 eu 


va 1 


his 


gl u 


ser 


phe 


leu 


Ser 


121/41 


















151/51 














TCC CCG 


TTT 


TGC 


TGG 


ATG 


CCC 


AGG 


CAC 


CGC 


CGG TAC 


TGC 


TGC 


GCT 


TAA 


GCT 


TGT 


CGC 


ACA 


ser pro 


phe 


cys 


trp 


met 


pro 


arg 


his 


arg 


arg tyr 


cys 


cys 


ala 


OCH 


ala 


cys 


arg 


thr 


181/61 


















211/71 














TGG TGC 


CGG 


CAG 


GGA 


GGA 


ACA 


GTG 


GGC 


AAG 


CAG CTA 


GCC 


GCG 


CTC 


GCC 


GCG 


CTG 


GTC 


GGT 


trp cys 


arg 


gin 


gly gly 


thr 


val 


gly 


lys 


gin leu 


ala 


ala 


leu 


ala 


ala 


leu 


val 


gly 


241/81 


















271/91 
















GCG TGC 


ATG 


CTC 


GCA 


GCC 


GGA 


TGC 


ACC 


AAC 


GTG GTC 


GAC 


GGG 


ACC 


GCC 


GJG 


GCT 


GCC 


GAC 


ala cys 


met 


leu 


ala 


ala 


gly 


cys 


thr 


asn 


val val 


asp 


gly 


thr 


ala 


val 


ala 


ala 


asp 


301/101 






























AAA TCC 


GGA 


CCA 


CTG 


CAT 


CAG 


GAT 


C 






















lys ser 


gly 


pro 


leu 


his 


gin 


asp 

























SEQ ID N° 20A' 
FIGURE 2 OA' 



1/1 


















31/11 


















GTG GGA 


CTC 


ACG 


TTC 


GGT 


GAG 


GGT 


ACA 


GCG 


GAC CTT 


CGA 


GCA 


CGC 


AAT 


ATC 


GTG 


GGC 


CGG 


val gly 


leu 


thr 


phe 


gly 


glu 


gly 


thr 


ala 


asp leu 


arg 


ala 


arg 


asn 


ile 


val 


gly 


arg 


61/21 


















91/31 












CTG GCA 


ACC 


•GTC 


GGT 


TTC 


GAC 


GTT 


GGT 


GAC 


GAC CCC 


TCG 


TTC 


ATG 


AAT 


CGT 


TCT 


TGA 


GCT 


leu ala 


thr 


val 


gly 


phe 


asp 


val 


gly 


asp 


asp pro 


ser 


ph e 


met 


asn 


a rg 


ser 


CPA 


ala 


121/41 


















151/51 
















CCC CGT 


TTT 


GCT 


GGA 


TGC 


CCA 


GGC 


ACC 


GCC 


GGT ACT 


GCT 


GCG 


CTT 


AAG 


CTT 


GTC 


GCA 


CAT 


pro arg 


phe 


ala 


gly 


cys 


pro 


gly 


thr 


ala 


gly thr 


ala 


ala 


leu 


lys 


leu 


val 


ala 


his 


181/61 


















211/71 
















GGT GCC 


GGC 


AGG 


GAG 


GAA 


CAG 


TGG 


GCA 


AGC 


AGC TAG 


CCG 


CGC 


TCG 


CCG 


CGC 


TGG 


TCG 


GTG 


gly ala 


gly 


arg 


glu 


glu 


gin 


trp 


ala 


ser 


ser AMB 


pro 


arg 


ser 


pro 


arg 


trp 


ser 


val 


241/81 


















271/91 










CGT GCA 


TGC 


TCG 


CAG 


CCG 


GAT 


GCA 


CCA 


ACG 


TGG TCG 


ACG 


GGA 


CCG 


CCG 


TGG 


CTG 


CCG 


ACA 


arg ala 


cys 


ser 


gin 


pro 


asp 


ala 


pro 


thr 


trp ser 


thr 


gly 


pro 


pro 


trp 


leu 


pro 


thr 


301/101 






























AAT CCG 


GAC 


CAC 


TGC 


ATC 


AGG 


ATC 
























asn pro 


asp 


his 


cys 


ile 


arg 


ile 

























SEQ ID N° 20B' 
FIGURE 20B' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



76/185 



1/1 








GTG TGG 


GAC 


TCA 


CGT 


val trp 




ser 


arg 


61/21 








GGC TGG 


CAA 


CCG 


TCG 


gly trp 


gin 


oro 


ser 


121/41 








CTC CCC 


GTT 


TTG 


CTG 


leu pro 


val 


leu 


leu 


181/61 








ATG GTG 


CCG 


GCA 


GGG 


met val 


pro 


ala 


gly 


241/81 








TGC GTG 


CAT 


GCT 


CGC 


cya val 


his 


ala 


arg 


301/101 








CAA ATC 


CGG 


ACC 


ACT 


gin ile 


arg 


thr 


thr 



TCG GTG AGG GTA CAG 
ser val arg val gin 

GTT TCG ACG TTG GTG 
val ser thr leu val 

GAT GCC CAG GCA CCG 
asp ala gin ala pro 

AGG AAC AGT GGG CAA 
arg asn ser gly gin 

AGC CGG ATG CAC CAA 
ser arg met his gin 

GCA TCA GGA TC 
ala ser gly 



31/11 








CGG ACC 


TTC 


GAG 


CAC 


arg thr 


phe 


glu 


his 


91/31 








ACG ACC 


CCT 


CGT 


TCA 


thr thr 


pro 


arg 


ser 


151/51 








CCG GTA 


CTG 


CTG 


CGC 


pro vai 


leu 


leu 


arg 


211/71 








GCA GCT 


AGC 


CGC 


GCT 


ala ala 


ser 


arg 


ala 


271/91 








CGT GGT 


CGA 


CGG 


GAC 


arg gly 


arg 


arg 


asp 



GCA ATA TCG TGG GCC 
ala ile ser trp ala 

TGA ATC GTT CTT GAG 
OPA ile val leu glu 

TTA AGC TTG TCG CAC 
leu ser leu ser his 

CGC CGC GCT GGT CGG 
arg arg ala gly arg 

CGC CGT GGC TGC CGA 
arg arg gly cys arg 



SEQ ID N° 20C 1 



FIGURE 20C 



sequence Rv3576 predite par Cole etal. (Nature 393:537-544) et contenant seq20A' 
1/1 31/11 

atg ggc aag cag eta gec gcg etc gec gcg ctg gtc ggt gcg tgc atg etc gca gec gga 
met gly lys gin leu ala ala leu ala ala leu val gly ala cys met leu ala ala gly 
61/21 91/31 

tgc acc aac gtg gtc gac ggg acc gec gtg get gec gac aaa tec gga cca ctg cat cag 
cys thr asn val val asp gly thr ala val ala ala asp lys ser gly pro leu his gin 
121/41 151/51 

gat ccg ata ccg gtt tea gcg ctt gaa ggg ctg ctt etc gac ttg age cag ate aat gec 
asp pro ile pro val ser ala leu glu gly leu leu leu aap leu ser gin ile asn ala 
181/61 211/71 

gcg ctg ggt gcg aca teg atg aag gtg tgg ttc aac gec aag gca atg tgg gac tgg age 
ala leu gly ala thr ser met lys val trp phe asn ala lys ala met trp aso tro ser 
241/81 271/91 

aag age gtg gee gac aag aat tgc ctg get ate gac ggt cca gca cag gaa aag gtc tat 
lys ser val ala asp lys asn cys leu ala lie asp gly pro ala gin glu lys val tyr 
301/101 331/111 

gee ggc acc ggg tgg acc get atg cgc ggc caa egg ctg gat gac age ate gat gac tec 
ala gly thr gly trp thr ala met arg gly gin arg leu aso asp ser ile asD asp ser 
361/121 391/131 

aag aaa cgc gac cac tac gec att caa gcg gtc gtc ggc ttc ccg acc gca cat gat gec 
lys lys arg asp his tyr ala ile gin ala val val gly phe pro thr ala his asp ala 
421/141 451/151 

gag gag ttc tac age tec teg gtg caa age tgg age age tgc teg aac cgc egg ttt gtc 
glu glu phe tyr ser ser ser val gin ser trp ser ser cys ser asn arg arg Dhe val 
481/161 511/171 

gaa gtc acc ccc gga cag gac gac gec gee tgg act gtg get gac gtt gtc aac gac aac 
glu val thr pro gly gin asp asp ala ala trp thr val ala asp val val asn aso asr. 
541/181 571/191 

ggc atg etc agt age teg cag gtt cag gaa ggc ggc gac gga tgg acc tgc cag cgt gec 
gly met leu ser ser ser gin val gin glu gly gly asp gly trp thr cys gin arg ala 
601/201 631/211 

ctg act gcg cgc aac aac gtc act ate gac att gtc acg tgc gec tat age caa ccg gat: 
leu thr ala arg asn asn val thr ile a3p ile val thr cys ala tyr ser gin oro asc 
661/221 691/231 

ttg gtg gcg att ggc ate get aac caa ate gcg gec aag gtt get aag cag tag 
leu val ala ile gly lie ala asn gin ile ala ala lys val ala lys gin AM 3 

SEQ ID N° 20D 

FIGURE 20D 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



77/185 



ORF d'apres 


Cole 


et 


al. 


(Nature 


393: 


537- 


544} et 


contenant Rv3576 








1/1 


















31/11 


















taa get 
OCH ala 
61/21 


tgt 
cys 


cgc 
arg 


aca 
thr 


tgg 
trp 


tgc 
cys 


egg 
arg 


cag 
gin 


gga 
gly 


gga aca 
gly thr 
91/31 


gtg 
val 


ggc 
gly 


aag 
lys 


cag 
gin 


eta 
leu 


gec 
ala 


gcg 
ala 


etc 
leu 


gec gcg 
ala ala 
121/41 


ctg 
leu 


gtc 
val 


ggt 
gly 


gcg 
ala 


tgc 
cys 


atg 
met 


etc 
leu 


gca 
ala 


gec gga 
ala gly 
151/51 


tgc 
cys 


acc 
thr 


aac 
asn 


gtg 
val 


gtc 
val 


gac 
asp 


ggg 

gly 


acc 
thr 


gec gtg 
ala val 
181/61 


get 
ala 


gec 
ala 


gac 
asp 


aaa 
lys 


tec 
ser 


gga cca 
gly pro 


ctg 
leu 


cat cag 
his gin 
211/71 


gat 
asp 


ccg 
pro 


ata 

ile 


ccg 
pro 


gtt 
val 


tea 
ser 


gcg 
ala 


ctt 
leu 


gaa ggg 
glu gly 
241/81 


ctg 
leu 


ctt 
leu 


etc 
leu 


gac 
asp 


ttg 
leu 


age 
ser 


cag 
gin 


ate 
ile 


aat gec 
asn ala 
271/91 


gcg 
ala 


ctg 
leu 


ggt 
gly 


gcg 
ala 


aca 
thr 


teg 
ser 


atg 
met 


aag 
lys 


gtg tgg 
val trp 
301/101 


ttc 
phe 


aac 
asn 


gee 
ala 


aag 
lys 


gca 
ala 


atg 
met 


tgg 
trp 


gac 
asp 


tgg age 
trp ser 
331/111 


aag 
lys 


age 
ser 


gtg 
val 


gec 
ala 


gac 
asp 


aag 
lys 


aat 
asn 


tgc 
cys 


ctg get 
leu ala 
361/121 


ate 
ile 


gac 
asp 


ggt 
gly 


cca 
pro 


gca 
ala 


cag 
gin 


gaa 
glu 


aag 
lys 


gtc tat 
val tyr 
391/131 


gec 
ala 


ggc 
gly 


acc 
thr 


ggg 

gly 


tgg 
trp 


acc 
thr 


get 
ala 


atg 
met 


cgc ggc 
arg gly 
421/141 


caa 
gin 


egg 
arg 


ctg 
leu 


gat 
asp 


gac 
asp 


age 
ser 


ate 
ile 


gat 
asp 


gac tec 
asp ser 
451/151 


aag 
lys 


aaa 
lys 


cgc 
arg 


gac 
asp 


cac 
his 


tac 
tyr 


gec 
ala 


att 
ile 


caa gcg 
gin ala 
481/161 


gtc 
val 


gtc 
val 


ggc 
gly 


ttc 
phe 


ccg 
pro 


acc 
thr 


gca 
ala 


cat 
his 


gat gee 
asp ala 
511/171 


gag 
glu 


gag 
glu 


ttc 
phe 


tac 
tyr 


age 
ser 


tec 
ser 


teg 
ser 


gtg 
val 


caa age 
gin ser 
541/181 


tgg 
trp 


age 
ser 


age 
ser 


tgc 
cys 


teg 
ser 


aac 
asn 


cgc 
arg 


egg 
arg 


ttt gtc 
phe val 
571/191 


gaa 
glu 


gtc 
val 


acc 
thr 


ccc 
pro 


gga 
gly 


cag 
gin 


gac 
asp 


gac 
asp 


gec gec 
ala ala 
601/201 


tgg 
trp 


act 
thr 


gtg 
val 


get 
ala 


gac 
asp 


gtt 
val 


gtc 
val 


aac 
asn 


gac aac 
asp asn 
631/211 


ggc 
gly 


atg 
met 


etc 
leu 


agt 
ser 


age 
ser 


teg 
ser 


cag 
gin 


gtt 
val 


cag gaa 
gin glu 
661/221 


ggc 
gly 


ggc 
gly 


gac 
asp 


gga 
gly 


tgg 
trp 


acc 
thr 


tgc 
cys 


cag 
gin 


cgt gec 
arg ala 
691/231 


ctg 
leu 


act 
thr 


gcg 
ala 


cgc 
arg 


aac 
asn 


aac 
asn 


gtc 
val 


act 
thr 


ate gac 
ile asp 
721/241 


att 
ile 


gtc 
vai 


acg 

thr 


tgc 
cys 


gee 
ala 


tat 
tyr 


age 
ser 


caa 
gin 


ccg gat 
pro asp 


ttg 

ieu 


gtg 
vai 


gcg 
ala 


att 

ile 


ggc 
gly 


ate 

ile 


get 
ala 


aac 
asn 


caa ate 
gin ile 


gcg 
ala 


gec 
ala 


aag 
lys 


gtt 
val 


get 
ala 


aag 
lys 


cag tag 
gin AMB 





















SEQ ID N° 20F 
FIGURE 20F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



78/185 



1/1 31/11 



GTC CTG 


GTC 


GCC 


GCG 


CAA 


CTG 


GCC 


GGT 


CCC 


GAT GGA 


AAG 


TGT 


TCA 


CGA 


TCG 


CGC 


TTC 


TCP 


val leu 


val 


ala 


ala 


gin 


leu 


ala 


alv 


pro 


asn alv 


1 vs 


cys 


ser 


a r g 


ser 


arg 


p he 


cys 


61/21 


















91/31 












CGC TGG 


TAG 


TGG 


CGA 


TGG 


TGT 


TAG 


CAG 


GAT 


TGC GGG 


TCG 


AGG 


CTG 


CGA 


TGG 


CCA 




CCA 


ara tro 

y 


AM 3 


tro 


arg 


trD 


cys 


AMB 


gin 


asp 


<~y=> y-*.y 


ser 


arg 


leu 


arg 


trp 


pro 


ai a 


pro 


121/41 


















151/51 
















GCG GCC 


TGC 


GGC 


TGG 


TCG 


CCG 


CGC 


GCG 


CCG 


AAA TGA 


TAC 


CCG 


CGA 


TCA 


CGA 


AAT 


ACA 


TGT 


ala ala 


cys 


gly 


trp 


ser 


pro 


arg 


ala 


pro 


lys OPA 


tvr 


pro 


arg 


ser 


a rg 


asn 


thr 


cys 


181/61 


















211/71 














CGG CGC 


TGG 


ACG 


TCG 


CCG 


TGC 


TGG 


CCA 


GCT 


CGA CCG 


GAC 


ACG 


ATG 


TGG 


AGG 


GGG 


CGC 


AGA 


arg arg 


r.rp 


cnr 


ser 


pro 


cys 


trp 


pro 


ala 


arg pro 


asp 


thr 


met 


trp 


arg 


gly 


arg 


arg 


241/81 


















271/91 














AAA ACT 


TCA 


CCG 


CCC 


GCA 


AGT 


ACG 


AGC 


TGC 


AGA CGC 


GAC 


TGG 


CCG 


ACA 


CCG 


ACG 


TCA 


TCG 


lys thr 


ser 


pro 


pro 


ala 


ser 


thr 


ser 


cys 


arg arg 


asp 


trp 


pro 


thr 


pro 


thr 


ser 


ser 


301/101 


















331/111 
















CAG ACG 


TGC 


GGT 


CGG 


GAG 


TGA 


ACA 


CGC 


TGC 


TCA ACG 


GCG 


GTC 


AGG 


CGC 


TGC 


TGG 


ATA 


AGA 


gin thr 


cys 


gly 


arg 


giu 


OPA 


thr 


arg 


cys 


ser thr 


ala 


val 


arg 


arg 


cys 


trp 


ile 


arg 


361/121 


























TGC TGG 


CCG 


ACA 


GCA 


TCG 


GCT 


TGC 


GGG 


ATC 




















cys trp 


pro 


thr 


ala 


ser 


ala 


cys 


gly 


ile 


































SEQ ID 


N° 21A 






























FIGURE 21A 




































32/11 


















TCC TGG 


TCG 


CCG 


CGC 


AAC 


TGG 


CCG 


GTC 


CCG 


ATG GAA 


AGT 


GTT 


CAC 


GAT 


ppp 


GCT 


TPT 


GCC 


ser trp 


ser 


pro 


a rg 


asn 


trn 


d r o 


val 


pro 


me t glu 


ser 


val 




asp 


arg 


a. X a 


ser 


a x a 


62/21 


















92/31 














GCT GGT 


AGT 


GGC 


GAT 


GGT 


GTT 


AGC 


AGG 


ATT 


GCG GGT 


CGA 


GGC 


TGC 


GAT 


GGC 


CAG 


PAP 


pap 


ala alv 


ser 


alv 

y j. y 


asD 


y y 


val 


ser 


arg 


ile 


ala gly 


arg 


gly 


cys 


asp 


gly 


gin 


hi s 


gin 


122/41 


















152/51 


















CGG CCT 


GCG 


GCT 


GGT 


CGC 


CGC 


GCG 


CGC 


CGA 


AAT GAT 


ACC 


CGC 


GAT 


CAC 


GAA 


ATA 


CAT 


GTC 


arg pro 


ala 


ala 


gly 


arg 


arg 


ala 


arg 


arg 


asn asp 


thr 


arg 


asp 


his 


glu 


ile 


his 


val 


182/61 


















212/71 


















GGC GCT 


GGA 


CGT 


CGC 


CGT 


GCT 


GGC 


CAG 


CTC 


GAC CGG 


ACA 


CGA 


TGT 


GGA 


GGG 


GGC 


GCA 


GAA 


gly ala 


gly 


arg 


arg 


arg 


ala 


gly 


gin 


leu 


asp arg 


thr 


arg 


cys 


gly 


gly 


gly 


ala 


glu 


242/81 


















272/91 
















AAA CTT 


CAC 


CGC 


CCG 


CAA 


GTA 


CGA 


GCT 


GCA 


GAC GCG 


ACT 


GGC 


CGA 


CAC 


CGA 


CGT 


CAT 


CGC 


lys leu 


his 


arg 


pro 


gin 


val 


arg 


ala 


ala 


asp ala 


thr 


gly 


arg 


his 


arg 


arg 


his 


arg 


302/101 


















332/111 














AG A CGT 


GCG 


GTC 


GGG 


AGT 


GAA 


CAC 


GCT 


GCT 


CAA CGG 


CGG 


TCA 


GGC 


GCT 


GCT 


GGA 


TAA 


GAT 


arg arg 


ala 


val 


gly 


ser 


glu 


his 


ala 


ala 


gin arg 


arg 


ser 


gly 


ala 


ala 


gly 


OCH 


asp 


362/121 


































GCT GGC 


CGA 


CAG 


CAT 


CGG 


CTT 


GCG 


GGA 


TC 




















ala gly 


arg 


gin 


his 


arg 


leu 


ala 


gly 























SEQ ID N° 21B 



FIGURE 21B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



79/185 





















33/11 


















CCT GGT 


CGC 


CGC 


GCA 


ACT 


GGC 


CGG 


TCC 


CGA 


TGG AAA 


GTG 


TTC 


ACG 


ATC 


GCG 


CTT 


CTG 


CCG 


pro gly 
63/21 


arg 


arg 


ala 


thr 


cjl V 


arq 


ser 


arq 


trp lys 
93/31 


va 1 


phe 


thr 


ile 


ala 


leu 


leu 


pro 


CTG GTA 


GTG 


GCG 


ATG 


GTG 


TTA 


GCA 


GGA 


TTG 


CGG GTC 


GAG 


GCT 


GCG 


ATG 


GCC 


AGC 


ACC 


AGC 


leu val 
123/41 


val 


ala 


met 


val 


leu 


ala 


qlv 


leu 


arg val 
153/51 


qlu 


ala 


ala 


met 


ala 


ser 


thr 


ser 


GGC CTG 


CGG 


CTG 


GTC 


GCC 


GCG 


CGC 


GCC 


GAA 


ATG ATA 


CCC 


GCG 


ATC 


ACG 


AAA 


TAC 


ATG 


TCG 


qlv leu 
183/61 


arq 


leu 


val 


ala 


ala 


arq 


ala 


qlu 


me t ile 
213/71 


pro 


ala 


ile 


thr 


1 vs 


tvr 
c j *• 


me t 


ser 


GCG CTG 


GAC 


GTC 


GCC 


GTG 


CTG 


GCC 


AGC 


TCG 


ACC GGA 


CAC 


GAT 


GTG 


GAG 


GGG 


GCG 


CAG 


AAA 


ala leu 
243/81 


asp 


val 


ala 


val 


leu 


ala 


ser 


ser 


thr gly 
273/91 


his 


asp 


val 


glu 


gly 


ala 


gin 


lys 


AAC TTC 


ACC 


GCC 


CGC 


AAG 


TAC 


GAG 


CTG 


CAG 


ACG CGA 


CTG 


GCC 


GAC 


ACC 


GAC 


GTC 


ATC 


GCA 


asn phe 
303/101 


thr 


ala 


arg 


lys 


tyr 


glu 


leu 


gin 


thr arg 
333/111 


leu 


ala 


asp 


thr 


asp 


val 


ile 


ala 


GAC GTG 


CGG 


TCG 


GGA 


GTG 


AAC 


ACG 


CTG 


CTC 


AAC GGC 


GGT 


CAG 


GCG 


CTG 


CTG 


GAT 


AAG 


ATG 


asp val 
363/121 


arg 


ser 


gly 


val 


asn 


thr 


leu 


leu 


asn gly 


gly 


gin 


ala 


leu 


leu 


asp 


lys 


met 


CTG GCC 


GAC 


AGC 


ATC 


GGC 


TTG 


CGG 


GAT 


C 




















leu ala 


asp 


ser 


ile 


gly 


leu 


arg 


asp 























SEQ ID N° 21C 
FIGURE 21C 



partie de la sequence nucleotidique de seq21A 



1/1 


















31/11 


















ACG ATC 


GCG 


CTT 


CTG 


CCG 


CTG 


GTA 


GTG 


GCG 


ATG GTG 


TTA 


GCA 


GGA 


TTG 


CGG 


GTC 


GAG 


GCT 


thr ile 


ala 


leu 


leu 


pro 


leu 


val 


val 


ala 


met val 


leu 


ala 


gly 


leu 


arg 


val 


glu 


ala 


61/21 


















91/31 


















GCG ATG 


GCC 


AGC 


ACC 


AGC 


GGC 


CTG 


CGG 


CTG 


GTC GCC 


GCG 


CGC 


GCC 


GAA 


ATG 


ATA 


CCC 


GCG 


ala me t 


ala 


ser 


thr 


ser 


gly 


leu 


arg 


leu 


val ala 


ala 


arg 


ala 


glu 


met 


ile 


pro 


ala 


121/41 


















151/51 


















ATC ACG 


AAA 


TAC 


ATG 


TCG 


GCG 


CTG 


GAC 


GTC 


GCC GTG 


CTG 


GCC 


AGC 


TCG 


ACC 


GGA 


CAC 


GAT 


ile thr 


lys 


tyr 


met 


ser 


ala 


leu 


asp 


val 


ala val 


leu 


ala 


ser 


ser 


thr 


gly 


his 


asp 


181/61 


















211/71 


















GTG GAG 


GGG 


GCG 


CAG 


AAA 


AAC 


TTC 


ACC 


GCC 


CGC AAG 


TAC 


GAG 


CTG 


CAG 


ACG 


CGA 


CTG 


GCC 


val glu 


gly 


ala 


gin 


lys 


asn 


phe 


thr 


ala 


arg lys 


tyr 


glu 


leu 


gin 


thr 


arg 


leu 


ala 


241/81 


















271/91 


















GAC ACC 


GAC 


GTC 


ATC 


GCA 


GAC 


GTG 


CGG 


TCG 


GGA GTG 


AAC 


ACG 


CTG 


CTC 


AAC 


GGC 


GGT 


CAG 


asp thr 


asp 


val 


ile 


ala 


asp 


val 


arg 


ser 


gly val 


asn 


thr 


leu 


leu 


asn 


gly 


gly 


gin 


301/101 


















331/111 


















GCG CTG 


CTG 


GAT 


AAG 


ATG 


CTG 


GCC 


GAC 


AGC 


ATC GGC 


TTG 


CGG 


GAT 












ala leu 


leu 


asp 


lys 


met 


leu 


ala 


asp 


ser 


lie gly 


leu 


arg 


asp 













SEQ ID N° 21A* 
FIGURE 21A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



80/185 



1/1 31/11 



CGA TCG 


CGC 


TTC 


TGC 


CGC 


TGG 


TAG 


TGG 


CGA 


TGG TGT 


TAG 


CAG 


GAT 


TGC 


GGG 


TCG 


AGG 


CTG 


arg ser 


arg 


phe 


cys 


arg 


trp 


AMB 


trp 


arg 


trp cvs 


AMB 


gin 


asp 




nl u 
9-i.y 


ser 


a rg 


leu 


61/21 


















91/31 










CGA TGG 


CCA 


GCA 


CCA 


GCG 


GCC 


TGC 


GGC 


TGG 


TCG CCG 


CGC 


GCG 


CCG 


AAA 


TGA 


TAG 


CCG 


CGA 


arg trp 


pro 


ala 


pro 


ala 


ala 


cys 


gly 


trp 


ser pro 


arg 


ala 


pro 


lys 


OPA 


tyr 


pro 


arg 


121/41 


















151/51 










TCA CGA 


AAT 


ACA 


TGT 


CGG 


CGC 


TGG 


ACG 


TCG 


CCG TGC 


TGG 


CCA 


GCT 


CGA 


CCG 


GAC 


ACG 


ATG 


ser arg 


asn 


thr 


cys 


arg 


arg 


trp 


thr 


ser 


pro cys 


trp 


pro 


ala 


arg 


pro 


asp 


thr 


met 


181/61 


















211/71 












TGG AGG 


GGG 


CGC 


AGA 


AAA 


ACT 


TCA 


CCG 


CCC 


GCA AGT 


ACG 


AGC 


TGC 


AGA 


CGC 


GAC 


TGG 


CCG 


trp arg 


gly 


arg 


arg 


lys 


thr 


ser 


pro 


pro 


ala ser 


thr 


ser 


cys 


arg 


arg 


asp 


trp 


pro 


241/81 


















271/91 








ACA CCG 


ACG 


TCA 


TCG 


CAG 


ACG 


TGC 


GGT 


CGG 


GAG TGA 


ACA 


CGC 


TGC 


TCA 


ACG 


GCG 


GTC 


AGG 


thr pro 


thr 


ser 


ser 


gin 


thr 


cys 


gly 


arg 


glu OPA 


thr 


arg 


cys 


ser 


thr 


ala 


val 


arg 


301/101 


















331/111 












CGC TGC 


TGG 


ATA 


AGA 


TGC 


TGG 


CCG 


ACA 


GCA 


TCG GCT 


TGC 


GGG 


ATC 












arg cys 


trp 


ile 


arg 


cys 


trp 


pro 


thr 


ala 


ser ala 


cys 


gly 


ile 













SEQ ID N° 21B' 
FIGURE 21B 1 



1/1 31/11 



CAC GAT 


CGC 


GCT 


TCT 


GCC 


GCT 


GGT 


AGT 


GGC 


GAT GGT 


GTT 


AGC 


AGG 


ATT 


GCG 


GGT 


CGA 


GGC 


his asp 


arg 


ala 


ser 


ala 


ala 


gly 


ser 


gly 


asp gly 


val 


ser 


arg 


ile 


ala 


gly 


arg 


gly 


61/21 


















91/31 












TGC GAT 


GGC 


CAG 


CAC 


CAG 


CGG 


CCT 


GCG 


GCT 


GGT CGC 


CGC 


GCG 


CGC 


CGA 


AAT 


GAT 


ACC 


CGC 


cys asp 


gly 


gin 


his 


gin 


arg 


pro 


ala 


ala 


gly arg 


arg 


ala 


arg 


arg 


asn 


asp 


thr 


arg 


121/41 


















151/51 














GAT CAC 


GAA 


ATA 


CAT 


GTC 


GGC 


GCT 


GGA 


CGT 


CGC CGT 


GCT 


GGC 


CAG 


CTC 


GAC 


CGG 


ACA 


CGA 


asp his 


glu 


ile 


his 


val 


gly 


ala 


gly 


arg 


arg arg 


ala 


gly 


gin 


leu 


asp 


arg 


thr 


a rg 


181/61 


















211/71 












TGT GGA 


GGG 


GGC 


GCA 


GAA 


AAA 


CTT 


CAC 


CGC 


CCG CAA 


GTA 


CGA 


GCT 


GCA 


GAC 


GCG 


ACT 


GGC 


cys gly 


gly 


gly 


ala 


glu 


lys 


leu 


his 


arg 


pro gin 


val 


arg 


ala 


ala 


asp 


ala 


thr 


gly 


241/81 


















271/91 














CGA CAC 


CGA 


CGT 


CAT 


CGC 


AGA 


CGT 


GCG 


GTC 


GGG AGT 


GAA 


CAC 


GCT 


GCT 


CAA 


CGG 


CGG 


TCA 


arg his 


arg 


arg 


his 


arg 


arg 


arg 


ala 


val 


gly ser 


glu 


his 


ala 


ala 


gin 


arg 


arg 


ser 


301/101 


















331/111 












GGC GCT 


GCT 


GGA 


TAA 


GAT 


GCT 


GGC 


CGA 


CAG 


CAT CGG 


CTT 


GCG 


GGA 


TC 










gly ala 


ala 


gly 


OCH 


asp 


ala 


gly 


arg 


gin 


his arg 


leu 


ala 


gly 













SEQ ID N° 21C 
FIGURE 21C' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



81/185 



sequence Rv3365c predite par Cole et al . (Nature 393:537-544) et contenant 
Seq2lA' 



1/1 31/11 



gtg acc 
val thr 
61/21 


atg 
met 


ttc 
phe 


gec 
ala 


cgc 
arg 


ccg 
pro 


acc 
thr 


ate 
ile 


ccg 
pro 


gtc gcg 
val ala 
91/31 


gcg 
ala 


gec 
ala 


get 
ala 


tct 
ser 


gat 
asp 


att 
ile 


tec 
ser 


gec 
ala 


ccg get 
pro ala 
121/41 


caa 
gin 


ccg 
pro 


gec 
ala 


cgc 
arg 


ggc 
gly 


aaa 
lys 


cct 
pro 


cag 
gin 


caa cgc 
gin arg 
151/51 


ccg 
pro 


ccg 
pro 


tec 
ser 


tgg 
trp 


teg 
ser 


ccg 
pro 


cgc 
arg 


aac 
asn 


tgg ccg 
trp pro 
181/61 


gtc 
val 


cga 
arg 


tgg 
trp 


aaa 
lys 


gtg 
val 


ttc 
phe 


acg 
thr 


ate 
ile 


gcg ctt 
ala leu 
211/71 


ctg 
leu 


ccg 
pro 


ctg 
leu 


gta 
val 


gtg 
val 


gcg 
ala 


atg 
met 


gtg 
val 


tta gca 
leu ala 
241/81 


gga 
gly 


ttg 
leu 


egg 
arg 


gtc 
val 


gag 
glu 


get 
ala 


gcg 
ala 


atg 
met 


gec age 
ala ser 
271/91 


acc 
thr 


age 
ser 


ggc 
gly 


ctg 
leu 


egg 
arg 


ctg 
leu 


gtc 
val 


gec 
ala 


gcg cgc 
ala arg 
301/101 


gec 
ala 


gaa 
glu 


atg 
met 


ata 
ile 


ccc 
pro 


gcg 
ala 


ate 
ile 


acg 
thr 


aaa tac 
lys tyr 
331/111 


atg 
met 


teg 
ser 


gcg 
ala 


ctg 
leu 


gac 
asp 


gtc 
val 


gee 
ala 


gtg 
val 


ctg gec 
leu ala 
361/121 


age 
ser 


teg 
ser 


acc 
thr 


gga 
gly 


cac 
his 


gat 
asp 


gtg 
val 


gag 
glu 


ggg gcg 
gly ala 
391/131 


cag 
gin 


aaa 
lys 


aac 
asn 


ttc 
phe 


acc 
thr 


gee 
ala 


cgc 
arg 


aag 
lys 


tac gag 
tyr glu 
421/141 


ctg 
leu 


cag 
gin 


acg 
thr 


cga 
arg 


ctg 
leu 


gec 
ala 


gac 
asp 


acc 
thr 


gac gtc 
asp val 
451/151 


ate 
lie 


gca 
ala 


gac 
asp 


gtg 
val 


egg 
arg 


teg 
ser 


gga 
gly 


gtg 
val 


aac acg 
asn thr 
481/161 


ctg 
leu 


etc 
leu 


aac 
asn 


ggc 
gly 


ggt 
gly 


cag 
gin 


gcg 
ala 


ctg 
leu 


ctg gat 
leu asp 
S 1 1 / 1 7 1 


aag 
lys 


gtg 
val 


ctg 
leu 


gec 
ala 


gac 
asp 


age 
ser 


ate 
ile 


ggc 
gly 


ttg egg 
leu arg 
541/181 


gat 
asp 


egg 
arg 


gtc 
val 


acc 
thr 


gee 
ala 


tac 
tyr 


gcg 
ala 


ccg 
pro 


ctg ctg 
leu leu 
571/191 


ttg 
leu 


acg 
thr 


gee 
ala 


cag 
gin 


aac 
asn 


gtg 

val 


att 
ile 


gac 
asp 


gcg teg 
ala ser 
601/201 


gtg 
val 


egg 
arg 


gtt 
val 


gac 
asp 


age 
ser 


gag 
glu 


caa 
gin 


ate 
ile 


cga acc 
arg thr 
631/211 


cag 
gin 


gtg 
val 


cag 
gin 


ggt 
gly 


ttg 
leu 


age 
ser 


cga 
arg 


gee 
ala 


gtt ggc 
val gly 
661/221 


gec 
ala 


cgc 
arg 


ggg 

gly 


cag atg 
gin met 


acg 
thr 


atg 
met 


cag 
gin 


gag ate 
glu ile 
691/231 


ctg 
leu 


gtg 
val 


act 
thr 


cgc 
arg 


ggc 
gly 


gee 
ala 


gac 
asp 


ctt 
leu 


gec gag 
ala glu 
721/241 


ccg 
pro 


caa 
gin 


ctg 
leu 


cgc 
arg 


age 
ser 


gcg 
ala 


atg 
me t 


gtt 
val 


acc ctg 
thr leu 
751/251 


gee 

did 


ggc 
gly 


acc 
cn r 


gaa 
glu 


ccc 
pro 


teg 
ser 


acg 
tn r 


ctg 
leu 


ttc ggg 
phe gly 
781/261 


atg 
met 


age 
ser 


gcg 
ala 


gcg 
ala 


etc 
leu 


ggt 
gly 


gca 
ala 


ggc 
gly 


teg ccg 
ser pro 
811/271 


gac 
asp 


acc 
thr 


aag 
lys 


aac 
asn 


ctg 
leu 


cag 
gin 


cag 
gin 


caa 
gin 


atg gtg 
met val 

841/281 


acc 
thr 


agg 
arg 


atg 
met 


gcg 
ala 


ate 
ile 


atg 
met 


tec 
ser 


gat 
asp 


ccg gec 
pro ala 
871/291 


gtt 
val 


gca 
ala 


ctg 
leu 


gtc 
val 


aac 
asn 


aac 
asn 


cca 
pro 


gag 
glu 


ctg ctg 
leu leu 
901/301 


cac 
his 


teg 
ser 


ata 
ile 


cag 
gin 


ate 
lie 


acc 
thr 


cgc 
arg 


gac 
asp 


att gec 
ile ala 
931/311 


gag 
glu 


cag 
gin 


gtg 
val 


ate 
ile 


acc 
thr 


gac 
asp 


acc 
thr 


acc 
thr 


gag gcg 
glu ala 
961/321 


gtg 
va 1 


acg 
thr 


aag 

1 y 5 


teg 
ser 


gtg 
val 


caa 
gin 


age 
ser 


cag 
gin 


gec acc 
ala thr 
991/331 


gac 
asp 


egg 
a rg 


egg 
arg 


gat 
asp 


gee 
ala 


gcg 
ala 


att 
lie 


cgc 
a rg 


gac gec 
asp ala 


gtg 
val 


ctg 
leu 


gtg 
val 


ttg 
leu 


gec 
ala 


gec 
ala 


ate 
ile 


gcg 
ala 


acc gcg 
thr ala 


ate 
ile 


gtc 
val 


gtc 
val 


gcg 
val 


ttg 
leu 


gtg 

Vd 1 


gtg 
va 1 


gcg 
ala 



SEQ ID N° 21F 



FIGURE 21D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



1021/341 

cgc acg ctg gtc ggg ccg atg 
arg thr leu val gly pro met 
1081/361 

gat etc gac ggc gag ate gcg 
asp leu asp gly glu ile ala 
1141/381 

gcg gtg tac acc acc gag gaa 
ala val tyr thr thr glu glu 
1201/401 

egg gee ctg ttg ctg gec ggc 
arg ala leu leu leu ala gly 
1261/421 

gag acc atg teg egg cgt age 
glu thr met ser arg arg ser 
1321/441 

ctg gag cgc aac gag gag gat 
leu glu arg asn glu glu asp 
1381/461 

gec gee egg ctg cgc cgc aac 
ala ala arg leu arg arg asn 
1441/481 

cgt gac cac cgc gag ccg gtg 
arg asp his arg glu pro val 
1501/501 

gag gac tat cgc cgc gtc gac 
glu asp tyr arg arg val asp 
1561/521 

get ggt ggc gtc att cat ctg 
ala gly gly val ile his leu 
1621/541 

ccg acc acaccc gtt egg gtt 
pro thr thr pro val arg val 
1681/561 

ate teg gat tec ggc ctg ggc 
ile ser asp ser gly leu gly 
1741/581 

egg gec ggc ggt gag gtc acc 
arg ala gly gly glu val thr 
1801/601 

egg ctg gee ggt egg cac ggc 
arg leu ala gly arg his gly 
1861/621 

ggc acc ggc acc acc gec gag 
gly thr gly thr thr ala glu 
1921/641 

gcg cag ccg cca aag ccg egg 
ala gin pro pro lys pro arg 
1981/651 

gec gat ccg acg gac gtt ccc 
ala asp pro thr asp val pro 



82/185 









1051/351 


egg 


gta 


ctg 


cgt gat ggg 


arg 


val 


leu 


arq asp qlv 








1111/371 


gcg 


gtc 


cgc 


gec ggc gac 


ala 


val 


arg 


ala gly asp 








1171/391 


ate 


ggt 


cag 


gtc gcg cat 


ile 


gly 


gin 


val ala his 








1231/411 


gag 


gaa 


acg 


egg ttg cga 


glu 


glu 


thr 


arg leu arg 








1291/431 


cgt 


tec 


ctg 


gtc gac cag 


arg 


ser 


leu 


val asp gin 








1351/451 


ccc 


gee 


cga 


etc gac age 


pro 


ala 


arg 


leu asp ser 








1411/471 


age 


gee 


aac 


ctg ctg gtg 


ser 


ala 


asn 


leu leu val 








1471/491 


ccg 


ctg 


tea 


acc gtg ate 


pro 


leu 


ser 


thr val ile 








1531/511 


ate 


gcg 


agg 


gta ccc gac 


ile 


ala 


arg 


val pro asp 








1591/531 


ctt 


gee 


9 a 9 


ctg ate gac 


leu 


ala 


glu 


leu ile asp 








1651/551 


gec 


gee 


gca 


ate ggc age 


ala 


ala 


ala 


ile gly ser 








1711/571 


atg 


acc 


gat 


gec gat egg 


met 


thr 


asp 


ala asp arg 








1771/591 


ccg 


gat 


agt 


gec egg cac 


pro 


asp 


ser 


ala arg his 








1831/611 


ate 


cga 


gtc 


ggg ctg cgc 


ile 


arg 


val 


gly leu arg 








1891/631 


gtc 


tac 


ctg 


ccg eta gee 


val 


tyr 


leu 


pro leu ala 








1951/651 


gta 


ttt 


gcg 


ate aag ccg 


val 


phe 


ala 


ile lys pro 








2011/671 


gec 


gec 


ate 


ggg ccg eta 


ala 


ala 


lie 


gly pro leu 



gcg 
ala 


etc 
leu 


aag 
lys 


gtt 
val 


get 
ala 


cat 
his 


acc 
thr 


gag 
glu 


ccg 
pro 


ate 
ile 


ccc 
pro 


gag 
glu 


cca 
pro 


ctg 
leu 


gcg 
ala 


gtc 
val 


gac 
asp 


gag 
glu 


ctg 
leu 


cac 
his 


acc 
thr 


ctg 
leu 


ctg 
leu 


gtc 
val 


aac 
asn 


gag 
glu 


atg 
met 


ttt 
phe 


cag 
gin 


ctg 
leu 


teg 
ser 


gtc 
val 


ate 
ile 


gac 
asp 


caa 
gin 


ctt 
leu 


ttc 
phe 


egg 
arg 


etc 
leu 


gat 
asp 


cac 
his 


ctg 
leu 


ctg 
leu 


gec 
ala 


ggt 
gly 


gcg 
ala 


cag 
gin 


att 
ile 


acc 
thr 


age 
ser 


gec 
ala 


gee 
ala 


gtg 
val 


tea 
ser 


gag 
glu 


gtc 
val 


tgt 
cys 


gcg 
ala 


gta 
val 


gtc 
val 


ggc 
gly 


gca 
ala 


gcg 
ala 


aac 
asn 


gcg 
ala 


ttg 
leu 


cgc 
arg 


tac 
tyr 


teg 
ser 


tea 
ser 


gaa 
glu 


ggc 
gly 


agt 
ser 


gtt 
val 


ctg 
leu 


ctg 
leu 


cga 
arg 


egg 
arg 


atg 
met 


gec 
ala 


aat 
asn 


atg 
met 


egg 
arg 


ctg 
leu 


atg 
met 


not 
gly 


leu 


ttc 
phe 


gta 
val 


gtc 
val 


ggc 
gly 


ggt 
gly 


ccg 
pro 


gtg 
val 


acc 
thr 


ggt 
gly 


gaa 
glu 


cag 
gin 


gtg 
val 


etc 
leu 


gag 
glu 


ggg 

gly 


acg 
thr 


gee 
ala 


cca 
pro 


ccg 
pro 


tgt 

cys 


cct 
pro 


gaa 
glu 


ccc 
pro 


gcg 
ala 


gcg 
ala 


cca 
pro 


ccg 
pro 


gtc 
val 


acg 
thr 


ttg 
leu 


etc 
leu 


ccg 
pro 



SEQ ID N° 21D (suite 1) 
FIGURE 21D (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



83/185 



2041/681 






cgc cgt acc 


ccg 


ggg 


arg arg thr 


pro 


gly 


2101/701 






egg cgc gag 


ctg 


aaa 


arg arg glu 


leu 


lys 


2161/721 






ccc gca cca 


gaa 


ccg 


pro ala pro 


glu 


pro 


2221/741 






gtt gat gac 


gac 


gtc 


val asp asp 


asp 


val 


2281/761 






ctg gec cac 


age 


ccc 


leu ala his 


ser 


pro 


2341/781 






gec gag gec 


gcg 


gac 


ala glu ala 


ala 


asp 


2401/801 






ccc ggg gec 


egg 


tta 


pro gly ala 


arg 


leu 


2461/821 






ggt gca gcg 


eta 


gca 


gly ala ala 


leu 


ala 


2521/841 






gcg gta cgc 


gac 


ccc 


ala val arg 


asp 


pro 


2581/861 






acc ggg egg 


teg 


cat 


thr gly arg 


ser 


his 



tec agt ggc ate gee 
ser ser gly ile ala 

aca ccc tgg tgg gag 
thr pro trp trp glu 

cga ccg gcg ccg ccg 
arg pro ala pro pro 

ate tac egg egg atg 
ile tyr arg arg met 

gat ctg gac tgg aag 
asp leu asp trp lys 

aag ccc gtg cag tec 
lys pro val gin ser 

gtg ccg ggg gcg gcg 
val pro gly ala ala 

tec aac ggc gga ctt 
ser asn gly gly leu 

gac gcg gtt cgt gee 
asp ala val arg ala 

gee cgc gag age agt 
ala arg glu ser ser 



2071/691 

gac gtc ccg gee cag 

asp val pro ala gin 
2131/711 

gat agg ttt caa cag 

asp arg phe gin gin 
2191/731 

ccc gec aaa ccc gcg 

pro ala lys pro ala 
2251/751 

etc tec gag atg gtg 

leu ser glu met val 
2311/771 

teg gtg tgg gac cac 

ser val trp asp his 
2371/791 

cgc acg gac tac ggc 

arg thr asp tyr gly 
2431/811 

gtg cct gag gga ccc 

val pro glu gly pro 
2491/831 

cat ccc ggc cga gcg 

his pro gly arg ala 
2551/851 

tec ate age age cat 

ser ile ser ser his 
2611/871 

cag gga ccc aat cag 

gin gly pro a sr. gin 



ccg atg cag cag egg 
pro met gin gin arg 

gag ccc aaa caa ccg 
glu pro lys gin pro 

cca ccg gcg ggc ccg 
pro pro ala gly pro 

ggt gac ccg cac gag 
gly asp pro his glu 

ggc tgg teg gcg gee 
gly trp ser ala ala 

ctg ccg gtg cgc gaa 
leu pro val arg glu 

gat egg gag cat ccg 
asp arg glu his pro 

ccg egg cac gcg get 
pro arg his ala ala 

ttc ggc ggc gtg cgc 
phe gly gly val arg 

caa tga 
gin OPA 



SEQ ID N° 21D (suite) 
FIGURE 21D (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



84/185 



ORF d'apres 


par 


Cole et 


al. 


(Nature 


393 


537-544) 


et 


contennant Rv3365c 






1/1 


















31/11 


















taa ggg 
OCH gly 
61/21 


tgc 
cys 


ggc 
gly 


egg 
arg 


tgg 
trp 


cac 
his 


ggc 
gly 


cgc 
arg 


ggc 
gly 


cac gtg 
his val 
91/31 


acc 
thr 


atg 

met 


ttc 
phe 


gcc 
ala 


cgc 
arg 


ccg 
pro 


acc 
thr 


ate 
ile 


ccg gtc 
pro val 
121/41 


gcg 
ala 


gcg 
ala 


gcc 
ala 


get 
ala 


tct 
ser 


gat 
asp 


att 
ile 


tec 
ser 


gcc ccg 
ala pro 
151/51 


get 
ala 


caa 
gin 


ccg 
pro 


gcc 
ala 


cgc 
arg 


ggc 
gly 


aaa 
lys 


cct 
pro 


cag caa 
gin gin 
181/61 


cgc 
arg 


ccg 
pro 


ccg 
pro 


tec 
ser 


tgg 
trp 


teg 
ser 


ccg 
pro 


cgc 
arg 


aac tgg 
asn trp 
211/71 


ccg 
pro 


gtc 

val 


cga 
arg 


tgg 
trp 


aaa 
lys 


gtg 
val 


ttc 
phe 


acg 
thr 


ate gcg 
ixe ala 
241/81 


ctt 

i «... 
leu 


ctg 
leu 


ccg 
pro 


ctg 
leu 


gta 
val 


gtg 
val 


gcg 
ala 


atg 
met 


gtg tta 
val leu 
271/91 


gca 
ala 


gga 
gly 


ttg 
leu 


egg 
arg 


gtc 
val 


gag 
giu 


get 
ala 


gcg 
ala 


atg gcc 
met ala 
301/101 


age 
ser 


acc 
thr 


age 
ser 


ggc 
gly 


ctg 
leu 


egg 
arg 


ctg 
leu 


gtc 
val 


gcc gcg 
ala ala 
331/111 


cgc 
a rg 


gcc 
ala 


gaa 
giu 


atg 
met 


ata 
ile 


ccc 
pro 


gcg 
ala 


ate 
ile 


acg aaa 
thr lys 
361/121 


tac 
tyr 


atg 
met 


teg 
ser 


gcg 
ala 


ctg 
leu 


gac 
asp 


gtc 
val 


gcc 
ala 


gtg ctg 
val leu 
391/131 


gcc 
ala 


age 
ser 


teg 
ser 


acc 
thr 


gga 
gly 


cac 
his 


gat 
asp 


gtg 
val 


gag ggg 
giu gly 
421/141 


gcg 
ala 


cag 
gin 


aaa 
lys 


aac 
asn 


ttc 
phe 


acc 
thr 


gcc 
ala 


cgc 
arg 


aag tac 
lys tyr 
451/151 


gag 
giu 


ctg 
leu 


cag 
gin 


acg 
thr 


cga 
arg 


ctg 
leu 


gcc 
ala 


gac 
asp 


acc gac 
thr asp 
481/161 


gtc 
val 


ate 
ile 


gca 
ala 


gac 
asp 


gtg 
val 


egg 
arg 


teg 
ser 


gga 
gly 


gtg aac 
val asn 
511/171 


acg 
thr 


ctg 
leu 


etc 
leu 


aac 
asn 


ggc 
gly 


ggt 
gly 


cag 
gin 


gcg 
ala 


ctg ctg 
leu leu 
541/181 


gat 
asp 


aag 
lys 


gtg 
val 


ctg 
leu 


gcc 
ala 


gac 
asp 


age 
ser 


ate 
ile 


ggc ttg 
gly leu 
571/191 


egg 
arg 


gat 
asp 


egg 
a rg 


gtc 
val 


acc 
thr 


gcc 
ala 


tac 
tyr 


gcg 
ala 


ccg ctg 
pro leu 
601/201 


ctg 
leu 


ttg 

leu 


acg 
thr 


gcc 
ala 


cag 
gin 


aac 
asn 


gtg 
val 


att 
ile 


gac gcg 
asp ala 
631/211 


teg 

ser 


gtg 
val 


egg 
arg 


gtt 
val 


gac 
asp 


age 
ser 


gag 
giu 


caa 
gin 


a t" r r*rTA 

u LUG 

ile arg 
661/221 


acc 
thr 


cag 
gin 


gtg 
val 


cag 
gin 


ggt 
gly 


tug 
leu 


age 
ser 


cga 
arg 


gcc gtt 
ala val 
691/231 


gcc 
gly 


gcc 
ala 


cgc 
a rg 


ggg 

gly 


cag 
gin 


atg 
met 


acg 
thr 


atg 
met 


cag gag 
gin giu 
721/241 


ate 
ile 


ctg 
leu 


gtg 
val 


act 
thr 


cgc 
arg 


ggc 
gly 


gcc 
ala 


gac 
asp 


ctt gcc 
leu ala 
751/251 


gag 

giu 


ccg 
pro 


caa 
gin 


ctg 
leu 


cgc 
arg 


age 
ser 


gcg 
ala 


atg 
met 


gtt acc 
val thr 
781/261 


ctg 
leu 


gcc 
ala 


ggc 
gly 


acc 
thr 


gaa 
giu 


ccc 
pro 


teg 
ser 


acg 
thr 


ctg ttc 
leu phe 
811/271 


ggg 

gly 


atg 
met 


age 
ser 


gcg 
ala 


gcg 
ala 


etc 
leu 


ggt 
gly 


gca 
ala 


ggc teg 
gly ser 
841/281 


ccg 
p ro 


gac 
asp 


acc 
thr 


aag 
lys 


aac 
asn 


ctg 
leu 


cag 
gin 


cag 
gin 


caa atg 
gin met 
871/291 


gtg 
val 


acc 
thr 


agg 
arg 


atg 
met 


gcg 
ala 


ate 
ile 


atg 
met 


tec 
ser 


gat ccg 
asp pro 


gcc 
ala 


gtt 
val 


gca 
ala 


ctg 
leu 


gtc 
val 


aac 
asn 


aac 
asn 


cca 
pro 


gag ctg 
giu leu 


ctg 
leu 


cac 
his 


teg 
ser 


ata 
ile 


cag 
gin 


ate 
ile 


acc 
thr 


cgc 
arg 



SEQ ID N° 21F 
FIGURE 2 IF 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/0I813 



85/185 



901/301 931/311 

gac att gcc gag cag gtg ate acc gac acc acc gag gcg gtg acg aag teg gtg caa age 

asp ile ala glu gin val ile thr asp thr thr glu ala val thr lys ser val gin ser 
961/321 991/331 

cag gcc acc gac egg egg gat gcc gcg att cgc gac gcc gtg ctg gtg ttg gcc gcc ate 

gin ala thr asp arg arg asp ala ala ile arg asp ala val leu val leu ala ala ile 
1021/341 1051/351 

gcg acc gcg ate gtc gtc gtg ttg gtg gtg gcg cgc acg ctg gtc ggg ccg atg egg gta 

ala thr ala ile val val val leu val val ala arg thr leu val gly pro met arg val 
1081/361 1111/371 

ctg cgt gat ggg gcg etc aag gtt get cat acc gat etc gac ggc gag ate gcg gcg gtc 

leu arg asp gly ala leu lys val ala his thr asp leu asp gly glu ile ala ala val 
1141/381 1171/391 

cgc gcc ggc gac gag ccg ate ccc gag cca ctg gcg gtg tac acc acc gag gaa ate ggt 

arg ala gly asp glu pro ile pro glu pro leu ala val tyr thr thr glu glu ile qly 
1201/401 1231/411 

cag gtc gcg cat gcg gtc gac gag ctg cac acc egg gcc ctg ttg ctg gcc ggc gag gaa 

gin val ala his ala val asp glu leu his thr arg ala leu leu leu ala gly qlu qlu 
1261/421 1291/431 

acg egg ttg cga ctg ctg gtc aac gag atg ttt gag acc atg teg egg cgt age cgt tec 

thr arg leu arg leu leu val asn glu met phe glu thr met ser arg arg ser arg ser 
1321/441 1351/451 

ctg gtc gac cag cag ctg teg gtc ate gac caa ctg gag cgc aac gag gag gat ccc gcc 

leu val asp gin gin leu ser val ile asp gin leu glu arg asn glu glu asp pro ala 
1381/461 1411/471 

cga etc gac age ctt ttc egg etc gat cac ctg gcc gcc egg ctg cgc cgc aac age gcc 

arg leu asp ser leu phe arg leu asp his leu ala ala arg leu arg arg asn ser ala 
1441/481 . 1471/491 

aac ctg ctg gtg ctg gcc ggt gcg cag att acc cgt gac cac cgc gag ccg gtg ccg ctg 

asn leu leu val leu ala gly ala gin ile thr arg asn his arg glu pro val pro leu 
1501/501 1531/511 

tea acc gtg ate age gcc gcc gtg tea gag gtc gag gac tat cgc cgc gtc gac ate gcg 

ser thr val ile ser ala ala val ser glu val glu asp tyr arg arg val aso ile ala 
1561/521 1591/531 

agg gta ccc gac tgt gcg gta gtc ggc gca gcg get ggt ggc gtc att cat ctg ctt gcc 

arg val pro asp cys ala val val gly ala ala ala gly gly val ile his leu leu ala 
1621/541 1651/551 

gag ctg ate gac aac gcg ttg cgc tac teg tea ccg acc aca ccc gtt egg gtt gcc gcc 

glu leu ile asp asn ala leu arg tyr ser ser pro thr thr pro val arg val ala ala 
1681/561 1711/571 

gca ate ggc age gaa ggc agt gtt ctg ctg cga ate teg gat tec ggc ctg ggc atg acc 

ala ile gly ser glu gly ser val leu leu arg ile ser asp ser gly leu gly met thr 
1741/581 1771/591 

gat gcc gat egg egg atg gcc aat atg egg ctg egg gcc ggc ggt gag gtc acc ccg gat 

asp ala asp arg arg met ala asn met arg leu arg ala gly gly glu val thr oro asp 
1301/601 1831/611 

agt gcc egg cac atg ggt ctg ttc gta gtc ggc egg ctg gcc ggt egg cac ggc ate cga 

ser ala arg his met gly leu phe val val gly arg leu ala gly arg his gly ile arg 



SEQ ID N° 21F (suite 1) 
FIGURE 21F (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



86/185 



1861/621 
















1891/631 
















gtc ggg ctg 
val gly leu 
1921/641 


cgc 
arg 


ggt ccg 
gly pro 


gtg 
val 


ace 
thr 


ggt 
q! v 

z) J 


gaa 
alu 


cag ggc acc 
gin gly thr 
1951/651 


ggc 
al v 

y x _y 


acc 
thr 


acc 
thr 


gec 
ala 


gag 
glu 


gtc 
va 1 


tac 

t" v r 

uy r 


ctg ccg eta 
leu pro leu 
1981/661 


gec 
ala 


ata 
val 


etc 
leu 


gag 
qlu 


ggg 

crl v 


acg 
thr 


gee 
ala 


cca gcg cag 
pro ala gin 
2011/671 


ccg 
pro 


cca 
pro 


aag 

xys 


ccg 
p r o 


egg 


gta 
val 


ttt 
phe 


gcg ate aag 
ala ile lys 
2041/681 


ccg 
pro 


ccg 
pro 


tgt 
cys 


cct 
pro 


gaa 
qlu 


ccc 
pro 


gcg 
ala 


gcg gec gat 
ala ala asp 
2071/691 


ccg 
p ro 


acg 
thr 


gac 
asp 


gtt 


ccc 


gee 
ala 


gec 

A 1 A 

a JL a 


ate ggg ccg 
ile gly pro 
2101/701 


eta 
leu 


cca 
pro 


ccg 
pro 


gtc 
val 


acg 
thr 


ttg 
leu 


etc 
leu 


ccg cgc cgt 
pro arg arg 
2131/711 


acc 
thr 


ccg 
pro 


ggg 


tec 
ser 


agt 


ggc 
gly 


ate 

X x tr 


gec gac gtc 
ala asp val 
2161/721 


ccg 
pro 


gec 
ala 


caa 
gin 


ccg 
pro 


atg 
met 


cag 
qln 


cag 
qln 


egg egg cgc 
arg arg arg 
2191/731 


gag 
glu 


ctg 
leu 


aaa 


aca 
thr 


ccc 
pro 


tgg 


tgg 
trp 


gag gat agg 
glu asp arg 
2221/741 


ttt 
phe 


caa 
gin 


cag 
gin 


gag 
glu 


ccc 
pro 


aaa 
lys 


caa 
gin 


ccg ccc gca 
pro pro ala 
2251/751 


cca 
pro 


gaa 
glu 


ccg 
pro 


cga 
a rg 


ccg 
pro 


gcg 
ala 


ccg 
pro 


ccg ccc gec 
pro pro ala 
2281/761 


aaa 
lys 


ccc 
pro 


ala 


cca 
pro 


ccg 
pro 


gcg 
ala 


ggc 
al v 


ccg gtt gat 
pro val asp 
2311/771 


gac 
asp 


gac 
asp 


gtc 
val 


ate 
ile 


tac 

uyr 


egg 
arg 


egg 
arg 


atg etc tec 
met leu ser 
2341/781 


gag atg 
glu met 


y u y 
val 


ggt 
crl v 


gac 
asp 


ccg 
pro 

r J - u 


cac 
his 


gag ctg gee 
glu leu ala 
2371/791 


cac 
hi s 


age 
ser 


ccc 
pro 


gat 
asp 


ctg 
leu 


gac 
asp 


tgg 
trp 


aag teg gtg 
lys ser val 
2401/801 


tgg 
trp 


gac 
asp 


cac 
his 


ggc 

al v 
y ly 


tgg 
trp 


teg 
ser 


gcg 
ala 


gee gec gag 

A 1 A a 1 a nlll 

2431/811 


gee 


gcg 

A 1 A 
did 


gac 
asp 


aag 
lys 


ccc 
pro 


gtg 
va i 


cag 
gin 


tec cgc acg 
ser arg thr 
2461/821 


gac 
asp 


tac 
tyr 


ggc 
gly 


ctg 
leu 


ccg 
pro 


ata 
val 


cgc 
arg 


gaa ccc ggg 
glu pro gly 
2491/831 


y <_u 

ala 


^-y y 
arg 


t ta 
leu 


gtg 
val 


pro 


ggg 

gly 


gcg 
ala 


gcg gtg cct 
ala val pro 
2521/841 


gag 
glu 


gga 
gly 


ccc 
pro 


gat 
asp 


egg 
arg 


gag 
glu 


cat 
his 


ccg ggt gca 
pro gly ala 
2551/851 


gcg 
ala 


eta 
leu 


gca 
ala 


tec 
ser 


aac 
asn 


ggc 
gly 


gga 
gly 


ctt cat ccc 
leu his pro 
2581/861* 


ggc 
gly 


cga 
arg 


gcg 
ala 


ccg 
pro 


egg 
arg 


cac 
hi s 


gcg 
ala 


get gcg gta 
ala ala val 
2611/871 


cgc 
arg 


gac 
asp 


ccc 
pro 


gac 
asp 


gcg 
ala 


gtt 
val 


cgt 
arg 


gec tec ate 
ala ser ile 
2641/881 


age 
ser 


age 
ser 


cat 
his 


ttc 
phe 


ggc 
gly 


ggc 
gly 


gtg 
val 


cgc acc ggg 
arg thr gly 


egg 
arg 


teg 
ser 


cat 
his 


gec 
ala 


cgc 
arg 


gag 
glu 


age 
ser 


agt cag gga 
ser gin gly 


ccc 
pro 


aat 
asn 


cag 
gin 


caa 
gin 


tga 
OPA 























SEQ ID N° 21F (suite 2) 
FIGURE 21F (suite 2) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



87/185 



31/11 



CTA CGA 


CAA 


GGC 


AAA 


GGA 


GCA 


CAG 


GGT 


GAA 


GCG TGG 


ACT 


GAC 


GGT 


CGC 


GGT 


AGC 


CGG 


AGC 


leu arg 


gin 


gly 


lys 


gly 


ala 


gin 


gly 


glu 


ala trp 


thr 


asp 


gly 


arg 


gly 




arg 


ser 


61/21 


















91/31 












CGC CAT 


TCT 


GGT 


CGC 


AGG 


TCT 


TTC 


CGG 


ATG 


TTC AAG 


CAA 


CAA 


GTC 


GAC 


TAC 


AGG 


AAG 


CGG 


arg his 


ser 


gly 


arg 


arg 


ser 


phe 


arg 


met 


phe lys 


gin 


gin 


val 


asp 




arg 


lys 


a rg 


121/41 


















151/51 








TGA GAC 


CAC 


GAC 


CGC 


GGC 


AGG 


CAC 


GAC 


GGC 


AAG CCC 


CGG 


CGC 


CGC 


ATC 


CGG 


GCC 


GAA 




OPA asp 


his 


asp 


arg 


gly 


arg 


his 


asp 


gly 


lys pro 


arg 


a rg 


arg 


ile 


arg 


ala 


glu 


gly 


181/61 


















211/71 












CGT CAT 


CGA 


CGG 


TAA 


GGA 


CCA 


GAA 


CGT 


CAC 


CGG GTC 


TGT 


GGT 


GTG 


CAC 


AAC 


CGC 


GGC 


CGG 


arg his 


arg 


arg 


OCH 


gly 


pro 


glu 


arg 


his 


arg val 


cys 


gly 


val 


his 


asn 


arg 


gly 


arg 


241/81 


















271/91 












CAA TGT 


CAA 


CAT 


CGC 


GAT 


CGG 


CGG 


GGC 


GGC 


GAC CGG 


CAT 


TGC 


CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


gin cys 


gin 


his 


arg 


asp 


arg 


arg 


gly 


gly 


asp arg 


his 


cys 


arg 


arg 


ala 


his 


arg 


arg 


301/101 


















331/111 










CAA CCC 


TCC 


GGA 


GGT 


GAA 


GTC 


CGT 


TGG 


GCT 


CGG TAA 


CGT 


CAA 


CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


gin pro 


ser 


gly 


gly 


glu 


val 


arg 


trp 


ala 


arg OCH 


arg 


gin 


arg 


arg 


his 


ala 


gly 


ile 


361/121 


















391/131 












CAC GTC 


GGG 


CAC 


CGG 


ACA 


GGG 


TAA 


CGC 


TCG 


GCA ACC 


AAG 


GAC 


GGC 


AGC 


CAC 


TAC 


AAG 


ATC 


his val 


gly 


his 


arg 


thr 


gly 


OCH 


arg 


ser 


ala thr 


lys 


asp 


gly 


ser 


his 


tyr 


lys 


ile 



SEQ ID N° 22A 
FIGURE 22A 





















32/11 


















TAC GAC 


AAG 


GCA 


AAG 


GAG 


CAC 


AGG 


GTG 


AAG 


CGT GGA 


CTG 


ACG 


GTC 


GCG 


GTA 


GCC 


GGA 


GCC 


tyr asp 


lys 


.ala 


lys 


glu 


his 


arg 


val 


lys 


arg gly 


leu 


thr 


val 


ala 


val 


ala 


gly 


ala 


62/21 


















92/31 
















GCC ATT 


CTG 


GTC 


GCA 


GGT 


CTT 


TCC 


GGA 


TGT 


TCA AGC 


AAC 


AAG 


TCG 


ACT 


ACA 


GGA 


AGC 


GGT 


ala ile 


leu 


val 


ala 


gly 


leu 


ser 


gly 


cys 


ser ser 


asn 


lys 


ser 


thr 


thr 


gly 


ser 


gly 


122/41 


















152/51 














GAG ACC 


ACG 


ACC 


GCG 


GCA 


GGC 


ACG 


ACG 


GCA 


AGC CCC 


GGC 


GCC 


GCA 


TCC 


GGG 


CCG 


AAG 


GTC 


glu thr 


thr 


thr 


ala 


ala 


gly 


thr 


thr 


ala 


ser pro 




ala 


ala 


ser 


gly 


pro 


1 ys 


val 


182/61 


















212/71 














GTC ATC 


GAC 


GGT 


AAG 


GAC 


CAG 


AAC 


GTC 


ACC 


GGG TCT 


GTG 


GTG 


TGC 


ACA 


ACC 


GCG 


GCC 


GGC 


val ile 


asp 


gly 


lys 


asp 


gin 


asn 


val 


thr 


gly ser 


val 


va 1 


cys 


thr 


thr 


ala 


ala 


gly 


242/81 


















272/91 
















AAT GTC 


AAC 


ATC 


GCG 


ATC 


GGC 


GGG 


GCG 


GCG 


ACC GGC 


ATT 


GCC 


GCC 


GTG 


CTC 


ACC 


GAC 


GGC 


asn val 


asn 


ile 


ala 


ile 


gly 


gly 


ala 


ala 


thr gly 


ile 


ala 


ala 


val 


leu 


thr 


asp 


gly 


302/101 


















3 32/111 














AAC CCT 


CCG 


GAG 


GTG 


AAG 


TCC 


GTT 


GGG 


CTC 


GGT AAC 


GTC 


AAC 


GGC 


GTC 


ACG 


CTG 


GGA 


TAC 


asn pro 


pro 


glu 


val 


1 ys 


ser 


val 


gly 


leu 


gly a s n 


va 1 


asn 


gly 


val 


thr 


leu 


gly 


tyr 


362/121 


















392/131 


















ACG TCG 


GGC 


ACC 


GGA 


CAG 


GGT 


AAC 


GCT 


CGG 


CAA CCA 


AGG 


ACG 


GCA 


GCC 


ACT 


ACA 


AGA 


TC 


thr ser 


gly 


thr 


gly 


gin 


gly 


asn 


ala 


arg 


gin pro 


arg 


thr 


aid 


ala 


thr 


thr 


arg 





SEQ ID N° 22B 
FIGURE 22B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



88/185 



ACG ACA AGG CAA AGG 
thr thr arg gin arg 
63/21 

CCA TTC TGG TCG CAG 
pro phe trp ser gin 
123/41 

AGA CCA CGA CCG CGG 
arg pro arg pro arg 
183/61 

TCA TCG ACG GTA AGG 
ser ser thr val arg 
243/81 

ATG TCA ACA TCG CGA 
met ser thr ser arg 
303/101 

ACC CTC CGG AGG TGA 
thr leu arg arg OPA 
363/121 

CGT CGG GCA CCG GAC 
arg arg ala pro asp 



AGC ACA GGG TGA AGC 
ser thr gly OPA ser 

GTC TTT CCG GAT GTT 
val phe pro asp val 

CAG GCA CGA CGG CAA 
gin ala arg arg gin 

ACC AGA ACG TCA CCG 
thr arg thr ser pro 

TCG GCG GGG CGG CGA 
ser ala gly arg arg 

AGT CCG TTG GGC TCG 
ser pro leu gly ser 

AGG GTA ACG CTC GGC 
arg val thr leu gly 

SEQ ID 



33/11 

GTG GAC TGA CGG TCG 
val asp OPA arg ser 
93/31 

CAA GCA ACA AGT CGA 
gin ala thr ser arg 
153/51 

GCC CCG GCG CCG CAT 
ala pro ala pro his 
213/71 

GGT CTG TGG TGT GCA 
gly leu trp cys ala 
273/91 

CCG GCA TTG CCG CCG 
pro ala leu pro oro 
333/111 

GTA ACG TCA ACG GCG 
val thr ser thr ala 
393/131 

AAC CAA GGA CGG CAG 
asn gin gly arg gin 

N° 22C 



CGG TAG CCG GAG CCG 
arg AMB pro glu pro 

CTA CAG GAA GCG GTG 
leu gin glu ala val 

CCG GGC CGA AGG TCG 
pro gly arg arg ser 

CAA CCG CGG CCG GCA 
gin pro arg pro ala 

TGC TCA CCG ACG GCA 
cys ser pro thr ala 

TCA CGC TGG GAT ACA 
ser arg trp asp thr 

CCA CTA CAA GAT C 
pro leu gin asp 



FIGURE 22C 



GCA CAA CCG CGG CCG 
ala gin pro arg pro 
61/21 

CCG TGC TCA CCG ACG 
pro cys ser pro thr 
121/41 

GCG TCA CGC TGG GAT 
ala ser arg trp asp 
181/61 

GCA GCC ACT ACA AGA 
ala ala thr thr arg 
241/81 

CAT TCT GGT CGC AGG 
his ser gly arg arg 
301/101 

GAC CAC GAC CGC GGC 
asp his asp arg gly 
361/121 

ATC GAC GGT AAG GAC 
ile asp gly lys asp 
421/141 

GTC AAC ATC GCG ATC 
val asn ile ala ile 
481/161 

CCT CCG GAG GTG AAG 
pro pro glu val lys 
541/181 

T:G GGC ACC GGA CAG 
ser gly thr gly gin 



GCA ATG TCA ACA TCG 
ala met ser thr ser 

GCA ACC CTC CGG AGG 
ala thr leu arg arg 

ACA CGT CGG GCA CCG 
thr arg arg ala pro 

TCA CAG GGT GAA GCG 
ser gin gly glu ala 

TCT TTC CGG ATG TTC 
ser phe arg met phe 

AGG CAC GAC GGC AAG 
arg his asp gly lys 

CAG AAC GTC ACC GGC 
gin asn val thr gly 

GGC GGG GCG GCG ACC 
gly gly ala ala thr 

TCC GTT GGG CTC GGT 
ser val gly leu gly 

GGT AAC GCC TCG GCA 
gly asn ala ser ala 

SEQ IC 



31/11 

CGA TCG GCG GGG CGG 
arg ser ala gly arg 
91/31 

TGA AGT CCG TTG GGC 
OPA ser pro leu gly 
151/51 

GAC AGG GTA ACG CCT 
asp arg val thr pro 
211/71 

TGG ACT GAC GGT CGC 
trp thr asp gly arg 
271/91 

AAG CAA CAA GTC GAC 
lys gin gin val asp 
331/111 

CCC CGG CGC CGC TCC 
pro arg arg arg ser 
391/131 

TCC GTG GTG TGC ACA 
ser val val cys thr 
451/151 

GGC ATT GCC GCC GTG 
gly ile ala ala val 
511/171 

AAC GTC AAC GGC GTC 
asn val asn g I / v a i 
571/191 

ACC AAG GAC GGC AGC 
thr lys asp gly ser 

N° 23A 



CGA CCG GCA TTG CCG 
arg pro ala leu pro 

TCG GTA ACG TCA ACG 
ser val thr ser thr 

CGG CAA CCA AGG ACG 
arg gin pro arg thr 

GGT AGC CGG AGC CGC 
gly ser arg ser arg 

TAC AGG AAG CGG TGA 
tyr arg lys arg OPA 

GGG CCG AAG GTC GTC 
gly pro lys val val 

ACC GCG GCC GGC AAT 
thr ala ala gly asn 

CTC ACC GAC GGC AAC 
leu thr asp gly asr. 

ACG CTG GGA TAC ACG 
thr leu g 1 y r y r t'r.r 

CAC TAC AAG ATC 
his tyr lys lie 



FEUILLE DE REMRLA£g*ftE!f§ jREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



89/185 



CAC AAC CGC GGC CGG CAA TGT CAA CAT CGC 
his asn arg gly arg gin cys gin his arg 
62/21 

CGT GCT CAC CGA CGG CAA CCC TCC GGA GGT 
arg ala his arg arg gin pro ser gly gly 
122/41 

CGT CAC GCT GGG ATA CAC GTC GGG CAC CGG 
arg his ala gly ile his val gly his arg 
182/61 

CAG CCA CTA CAA GAT CAC AGG GTG AAG CGT 
gin pro leu gin asp his arg val lys arg 
242/81 

ATT CTG GTC GCA GGT CTT TCC GGA TGT TCA 
ile leu val ala gly leu ser gly cys ser 
302/101 

ACC ACG ACC GCG GCA GGC ACG ACG GCA AGC 
thr thr thr ala ala gly thr thr ala ser 
362/121 

TCG ACG GTA AGG ACC AGA ACG TCA CCG GCT 
ser thr val arg thr arg thr ser pro ala 
422/141 

TCA ACA TCG CGA TCG GCG GGG CGG CGA CCG 
ser thr ser arg ser ala gly arg arg pro 
482/161 

CTC CGG AGG TGA AGT CCG TTG GGC TCG GTA 
leu arg arg OPA ser pro leu gly ser val 
542/181 

CGG GCA CCG GAC AGG GTA ACG CCT CGG CAA 
arg ala pro asp arg val thr pro arg gin 



32/11 


















GAT CGG 


CGG 


GGC 


GGC 


GAC 


CGG 


CAT 


TGC 


CGC 


asp arg 
92/31 


arg 


gly 


gly 


asp 


arg 


his 


cys 


arg 


GAA GTC 


CGT 


TGG 


GCT 


CGG 


TAA 


CGT 


CAA 


CGG 


glu val 
152/51 


arg 


trp 


ala 


arg 


OCH 


arg 


gin 


arg 


ACA GGG 


TAA 


CGC 


CTC 


GGC 


AAC 


CAA 


GGA 


CGG 


thr gly 
212/71 


OCH 


arg 


leu 


gly 


asn 


gin 


gly 


arg 


GGA CTG 


ACG 


GTC 


GCG 


GTA 


GCC 


GGA 


GCC 


GCC 


gly leu 
272/91 


thr 


val 


ala 


val 


ala 


gly 


ala 


ala 


AGC AAC 


AAG 


TCG 


ACT 


ACA 


GGA 


AGC 


GGT 


GAG 


ser asn 
332/111 


lys 


ser 


thr 


thr 


gly 


ser 


gly 


glu 


CCC GGC 


GCC 


GCT 


CCG 


GGC 


CGA 


AGG 


TCG 


TCA 


pro gly 
*392/131 


ala 


ala 


pro 


gly 


arg 


arg 


ser 


ser 


CCG TGG 


TGT 


GCA 


CAA 


CCG 


CGG 


CCG 


GCA 


ATG 


pro trp 
452/151 


cys 


ala 


gin 


pro 


arg 


pro 


ala 


met 


GCA TTG 


CCG 


CCG 


TGC 


TCA 


CCG 


ACG 


GCA 


ACC 


ala leu 
512/171 


pro 


pro 


cys 


ser 


pro 


thr 


ala 


thr 


ACG TCA 


ACG 


GCG 


TCA 


CGC 


TGG 


GAT 


ACA 


CGT 


thr ser 
572/191 


thr 


ala 


ser 


arg 


trp 


asp 


thr 


arg 


CCA AGG 


ACG 


GCA 


GCC 


ACT 


ACA 


AGA 


TC 




pro arg 


thr 


ala 


ala 


thr 


thr 


arg 







SEQ ID N° 23B 
FIGURE 23B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



90/185 





















33/11 


















ACA ACC 


GCG 


GCC 


GGC 


AAT 


GTC 


AAC 


ATC 


GCG 


ATC GGC 


GGG 


GCG 


GCG 


ACC 


GGC 


ATT 


GCC 


GCC 


thr thr 


ala 


ala 


gly 


asn 


val 


asn 


ile 


ala 


ile gly gly 


ala 


ala 


thr 




ile 


ala 




63/21 


















93/31 
















GTG CTC 


ACC 


GAC 


GGC 


AAC 


CCT 


CCG 


GAG 


GTG 


AAG TCC 


GTT 


GGG 


CTC 


GGT 


AAC 


GTC 


AAC 


GGC 


val leu 
123/41 


thr 


asp 


gly 


asn 


pro 


pro 


glu 


val 


lys ser 
153/51 


val 


gly 


leu 


al v 


asn 


va 1 


asn 


gly 


GTC ACG 


CTG 


GGA 


TAC 


ACG 


TCG 


GGC 


ACC 


GGA 


CAG GGT 


AAC 


GCC 


TCG 


GCA 


ACC 


AAG 


GAC 


GGC 


val thr 
183/61 


leu 


gly 


tyr 


thr 


ser 


gly 


thr 


gly 


gin gly 
213/71 


asn 


ala 


ser 


ala 


thr 


1 vs 
x Jr 


asp 




AGC CAC 


TAG 


AAG 


ATC 


ACA 


GGG 


TGA 


AGC 


GTG 


GAC TGA 


CGG 


TCG 


CGG 


TAG 


CCG 


CAG 


CCG 


CCA 


ser his 


tyr 


lys 


ile 


thr 


gly 


OPA 


ser 


val 


asp OPA 


arg 


ser 


a rq 


AMB 


pro 


glu 


pro 


pro 


243/81 


















273/91 








TTC TGG 


TCG 


CAG 


GTC 


TTT 


CCG 


GAT 


GTT 


CAA 


GCA ACA 


AGT 


CGA 


CTA 


CAG 


GAA 


GCG 


GTG 


AGA 


phe trp 


ser 


gin 


val 


phe 


pro 


asp 


val 


gin 


ala thr 


ser 


ara 


leu 


gin 


glu 


ala 


va 1 


arg 


303/101 


















333/111 










CCA CGA 


CCG 


CGG 


CAG 


GCA 


CGA 


CGG 


CAA 


GCC 


CCG GCG 


CCG 


CTC 


CGG 


GCC 


GAA 


GGT 


CGT 


CAT 


pro arg 


pro 


arg 


gin 


ala 


arg 


arg 


gin 


ala 


pro ala 


pro 


leu 


arg 


ala 


glu 


gly 


arg 


his 


363/121 


















393/131 










CGA CGG 


TAA 


GGA 


CCA 


GAA 


CGT 


CAC 


CGG 


CTC 


CGT GGT 


GTG 


CAC 


AAC 


CGC 


GGC 


CGG 


CAA 


TGT 


arg arg 


OCH 


gly 


pro 


glu 


arg 


his 


arg 


leu 


arg gly 


val 


his 


asn 


arg 


gly 


arg 


gin 


cys 


423/141 


















453/151 








CAA CAT 


CGC 


GAT 


CGG 


CGG 


GGC 


GGC 


GAC 


CGG 


CAT TGC 


CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


CAA 


CCC 


gin his 


arg 


asp 


arg 


arg 


gly 


gly 


asp 


arg 


his cys 


arg 


arg 


ala 


his 


arg 


arg 


gin 


pro 


483/161 


















513/171 










TCC GGA 


GGT 


GAA 


GTC 


CGT 


TGG 


GCT 


CGG 


TAA 


CGT CAA 


CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


CAC 


GTC 


ser gly 


gly 


glu 


val 


arg 


trp 


ala 


arg 


OCH 


arg gin 


arg 


arg 


his 


ala 


gly 


ile 


his 


val 


543/181 


















573/191 














GGG CAC 


CGG 


ACA 


GGG 


TAA 


CGC 


CTC 


GGC 


AAC 


CAA GGA 


CGG 


CAG 


CCA 


CTA 


CAA 


GAT 


C 




gly his 


arg 


thr 


gly 


OCH 


arg 


leu 


gly 


asn 


gin gly 


arg 


gin 


pro 


leu 


gin 


asp 







SEQ ID N° 23C 
FIGURE 23C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



91/185 



CTA ACG ACA GGC AAA 
leu thr thr gly lys 
61/21 

CGC CAT TCT GGT CGC 
arg his ser gly arg 
121/41 

TGA GAC CAC GAC CGC 
OPA asp his asp arg 
181/61 

GTC ATC GAC GGT AAG 
val ile asp gly lys 
241/81 

AAT GTC AAC ATC GCG 
asn val asn ile ala 
301/101 

AAC CCT CCG GAG GTG 
asn pro pro glu val 
361/121 

ACG TCG GGC ACC GGA 
thr ser gly thr gly 



GGA GCA CAG GGT GAA 
gly ala gin gly glu 

AGG TCT TTC CGG ATG 
arg ser phe arg met 

GGC AGG CAC GAC GGC 
gly arg his asp gly 

GAC CAG AAC GTC ACC 
asp gin asn val thr 

ATC GGC GGG GCG GCG 
ile gly gly ala ala 

AAG TCC GTT GGG CTC 
lys ser val gly leu 

CAG GGT AAC GCC TCG 
gin gly asn ala ser 



SEQ ID 
FIGUF 



31/11 








GCG TGG 


ACT 


GAC 


GGT 


ala trp 


thr 


asp 


Cll V 


91/31 








TTC AAG 


CAA 


CAA 


GTC 


phe lys 


a 1 n 


gin 


va 1 


151/51 








AAG CCC 


CGG 


CGC 


CGC 


lys pro 


a ra 


arg 


arg 


211/71 








GGC TCC 


GTG 


GTG 


TGC 


gly ser 


val 


val 


cys 


271/91 








ACC GGC 


ATT 


GCC 


GCC 


thr gly 


lie 


ala 


ala 


331/111 








GGT A^C 


GTC 


AAC 


GGC 


gly asp. 


val 


asn 


gly 


391/131 








GCA ACC 


AAG 


GAC 


GGC 


ala thr 


lys 


asp 


gly 



N° 24A 
E 24A 



CGC GGT AGC CGG AGC 
arg gly ser arg ser 

GAC TAC AGG AAG CGG 
asp tyr arg lys arg 

TCC GGG CCG AAG GTC 
ser gly pro lys val 

ACA ACC GCG GCC GGC 
thr thr ala ala gly 

GTG CTC ACC GAC GGC 
val leu thr asp gly 

GTC ACG CTG GGA TAC 
val thr leu gly tyr 

AGC CAC TAC AAG ATC 
ser his tyr lys ile 



TAA CGA CAG GCA AAG GAG CAC AGG GTG 
OCH arg gin ala lys glu his arg val 
62/21 

GCC ATT CTG GTC GCA GGT CTT TCC GGA 
ala ile leu val ala gly leu ser gly 
122/41 

GAG ACC ACG ACC GCG GCA GGC ACG ACG 
glu thr thr thr ala ala gly thr thr 
182/61 

TCA TCG ACG GTA AGG ACC AGA ACG TCA 
ser ser thr val arg thr arg thr ser 
242/81 

ATG TCA ACA TCG CGA TCG GCG GGG CGG 
met ser thr ser arg ser ala glv arg 
302/101 

ACC CTC CGG AGG TGA AGT CCG TTG GGC 
thr leu arg arg OPA ser oro leu glv 
362/121 

CGT CGG GCA CCG GAC AGG GTA ACG CCT 
arg arg ala pro asp arg val thr pro 



32/11 

AAG CGT GGA CTG ACG GTC GCG GTA GCC GGA GCC 

lys arg giy leu thr val ala val ala gly ala 

92/31 

TGT TCA AGC AAC AAG TCG ACT ACA GGA AGC GGT 

cys ser ser asn lys ser thr thr qly ser giy 
152/51 

GCA AGC CCC GGC GCC GCT CCG GGC CGA AGG TCG 

ala ser pro giy ala ala pro gly arg arg ser 
212/71 

CCG GCT CCG TGG TGT GCA CAA CCG CGG CCG GCA 

pro ala pro trp cys ala gin pro arg oro ala 
272/91 

CGA CCG GCA TTG CCG CCG TGC TCA CCG ACG GCA 

arg pro ala leu pro pro cys ser oro thr ala 
332/111 

TCG GTA ACG TCA ACG GCG TCA CGC TGG GAT ACA 

ser val thr ser thr ala ser arg trp a so thr 
392/131 

CGG CAA CCA AGG ACG GCA GCC ACT ACA AGA TC 

arg gin pro a:j thr ala ala thr thr arg 



SEQ ID N° 24B 



FIGURE 24B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCTYFR98/01813 



92/185 



33/11 



AAC GAC 


AGG 


CAA 


AGG 


AGC 


ACA 


GGG 


TGA 


AGC GTG GAC 


TGA 


CGG 


TCG 


CGG 


TAG 


CCG 


GAG 


CCG 


asn asp 


arg 


gin 


arg 


ser 


thr 


gly 


OPA 


ser val asp 


OPA 


arq 


ser 


a ra 


AMB 


d r o 


glu 


pro 


63/21 
















93/31 








CCA TTC 


TGG 


TCG 


CAG 


GTC 


TTT 


CCG 


GAT 


GTT CAA GCA 


ACA 


AGT 


CGA 


CTA 


CAG 


GAA 


GCG 


GTG 


pro phe 


trp 


ser 


gin 


val 


phe 


pro 


asp 


val gin ala 


thr 


ser 


arq 


leu 


gin 


glu 


ala 


val 


123/41 
















153/51 










AGA CCA 


CGA 


CCG 


CGG 


CAG 


GCA 


CGA 


CGG 


CAA GCC CCG 


GCG 


CCG 


CTC 


CGG 


GCC 


GAA 


GGT 


CGT 


arg pro 


arg 


pro 


arg 


gin 


ala 


arg 


arg 


gin ala pro 


ala 


pro 


leu 


arg 


ala 


glu 


gly 


arg 


183/61 
















213/71 










CAT CGA 


CGG 


TAA 


GGA 


CCA 


GAA 


CGT 


CAC 


CGG CTC CGT 


GGT 


GTG 


CAC 


AAC 


CGC 


GGC 


CGG 


CAA 


his arg 


arg 


OCH 


gly 


pro 


glu 


arg 


his 


arg leu arg 


gly 


val 


his 


asn 


a rg 


gly 


arg 


gin 


243/81 
















273/91 










TGT CAA 


CAT 


CGC 


GAT 


CGG 


CGG 


GGC 


GGC 


GAC CGG CAT 


TGC 


CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


CAA 


cys gin 


his 


arg 


asp 


arg 


arg 


gly 


qly 


asp arg his 


cys 


arg 


arg 


ala 


his 


arg 


arg 


gin 


303/101 
















333/111 










CCC TCC 


GGA 


GGT 


GAA 


GTC 


CGT 


TGG 


GCT 


CGG TAA CGT 


CAA 


CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


CAC 


pro ser 


gly 


gly 


glu 


val 


arg 


trp 


ala 


arg OCH arg 


gin 


arg 


arg 


his 


ala 


gly 


ile 


his 


363/121 
















393/131 














GTC GGG 


CAC 


CGG 


ACA 


GGG 


TAA 


CGC 


CTC 


GGC AAC CAA 


GGA 


CGG 


CAG 


CCA 


CTA 


CAA 


GAT 


C 


val gly 


his 


arg 


thr 


gly 


OCH 


arg 


leu 


gly asn gin 


gly 


arg 


gin 


pro 


leu 


gin 


asp 





SEQ ID N° 24C 
FIGURE 24C 



Amorce directe 
5* ACG CGG CGC AGC CTG TTG 3 



SEQ ID N° 25 
FIGURE 25 



Amorce inverse 
5' CGA CCT TGG GAT TCG CCT 3' 



SEQ ID N° 26 
FIGURE 26 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



93/185 



31/11 



CCT ACC 


AGC 


AAG 


AGC 


CCA 


GGG 


CTT 


CAC 


AGG 


ACC TAA 


AAG 


GAG 


TAG 


CGC 


CCA 


TGG 


GCT 


TGA 


pro thr 


ser 


lys 


ser 


pro 


gly 


leu 


his 


arg 


thr OCH 


lys 


glu 


AMB 


arg 


pro 


trp 


ala 


OPA 


bl/ 21 


















91/31 












TCC AAT 


TTT 


CCT 


TCC 


GCC 


CCG 


TGC 


AAT 


ACC 


ATC TGC 


AAG 


ACC 


AGC 


GAC 


GGC 


CCG 


TGG 


TTG 


ser asn 


phe 


pro 


ser 


ala 


pro 


cys 


asn 


thr 


ile cys 


lys 


thr 


ser 


asp 


gly 


pro 


trp 


leu 


121/41 


















151/51 










CGG TCG 


CGC 


AGC 


TTG 


CGG 


AAA 


CGG 


GGT 


ATG 


GAC CCT 


GCC 


GTA 


CCG 


TTG 


TTG 


CCA 


CTT 


GAT 


arg ser 


arg 


ser 


leu 


arg 


lys 


arg 


gly 


met 


asp pro 


ala 


val 


pro 


leu 


leu 


pro 


leu 


asp 


181/61 


















211/71 














GTC GTC 


GCT 


CTC 


CAC 


CCG 


TCG 


GGG 


GGC 


GAA 


AGC CAT 


TCC 


GAC 


ACT 


GGG 


ATC 




flan 




val val 


ala 


leu 


his 


pro 


ser 


gly 


gly 


glu 


ser his 


ser 


asp 


thr 


gly 


ile 


leu 


lys 


thr 


241/81 


















271/91 














TCG GCT 


GAG 


TGT 


CTG 


CAG 


GGC 


TCC 


GGG 


GAG 


CAG CCG 


ATC 


ATC 


ACC 


ATG 


TAC 


GAA 


CTG 


AAT 


ser ala 


glu 


cys 


leu 


gin 


gly 


ser 


gly 


glu 


gin pro 


ile 


ile 


thr 


met 


tyr 


glu 


leu 


asn 


301/101 


















331/111 














AAG TCC 


CCC 


CCG 


CGC 


GAC 


TTC 


CAG 


ACA 


TTT 


GTT GTG 


GTT 


TCG 


GTT 


GAG 


GCC 


GAG 


GCG 


AGG 


lys ser 


pro 


pro 


arg 


asp 


phe 


gin 


thr 


phe 


val val 


val 


ser 


val 


glu 


ala 


glu 


ala 


arg 


361/121 


















391/131 














CTC ATT 


TCG 


CAG 


CAA 


GCG 


GTC 


TCC 


GGG 


TCG 


CAG CAT 


CGT 


TGC 


GGC 


GAT 


CGC 


GGC 


GCA 


GTC 


leu ile 
421/141 


ser 


gin 


gin 


ala 


val 


ser 


gly 


ser 


gin his 


arg 


cys 


gly 


asp 


arg 


gly 


ala 


val 


GTC GGA 


CGA 


GTC 


GTC 


GTC 


AAC 


GAC 


CAC 


GAT 


C 


















val gly 


arg 


val 


val 


val 


asn 


asp 


his 


asp 


































SEQ ID 


N° 27A 






























FIGURE 27A 




































31/11 


















CTA CCA 


GCA 


AGA 


GCC 


CAG 


GGC 


TTC 


ACA 


GGA 


CCT AAA 


AGG 


AGT 


AGC 


GCC 


CAT 


GGG 


CTT 


GAT 


leu pro 


ala 


arg 


ala 


gin 


gly 


phe 


thr 


gly 


pro lys 


arg 


ser 


ser 


ala 


his 


gly 


leu 


asp 


61/21 


















91/31 














CCA ATT 


TTC 


CTT 


CCG 


CCC 


CGT 


GCA 


ATA 


CCA 


TCT GCA 


AGA 


CCA 


GCG 


ACG 


GCC 


CGT 


GGT 


TGC 


pro ile 


phe 


leu 


pro 


pro 


arg 


ala 


ile 


pro 


ser ala 


arg 


pro 


ala 


thr 


ala 


arg 


gly 


cys 


121/41 


















151/51 












GGT CGC 


GCA 


GCT 


TGC 


GGA 


AAC 


GGG 


GTA 


TGG 


ACC CTG 


CCG 


TAC 


CGT 


TGT 


TGC 


CAC 


TTG 


ATG 


gly arg 


ala 


ala 


cys 


gly 


asn 


gly 


val 


trp 


thr leu 


pro 


tyr 


arg 


cys 


cys 


his 


leu 


met 


181/ 61 


















211/71 










TCG TCG 


CTC 


TCC 


ACC 


CGT 


CGG 


GGG 


GCG 


AAA 


GCC ATT 


CCG 


ACA 


CTG 


GGA 


TCC 


TCA 


AAA 


CGT 


ser ser 


leu 


ser 


thr 


arg 


arg 


gly 


ala 


lys 


ala ile 


pro 


thr 


leu 


gly 


ser 


ser 


lys 


arg 


241/81 


















271/91 












CGG CTG 


AGT 


GTC 


TGC 


AGG 


GCT 


CCG 


GGG 


AGC 


AGC CGA 


TCA 


TCA 


CCA 


TGT 


ACG 


AAC 


TGA 


ATA 


arg leu 


ser 


val 


cys 


arg 


ala 


pro 


gly 


ser 


ser arg 


ser 


ser 


pro 


cys 


thr 


asn 


OPA 


lie 


301/101 


















331/111 














AGT CCC 


CCC 


CGC 


GCG 


ACT 


TCC 


AGA 


CAT 


TTG 


TTG TGG 


TTT 


CGG 


TTG 


AGG 


CCG 


AGG 


CGA 


GGC 


ser pro 


pro 


arg 


ala 


thr 


ser 


arg 


his 


Leu 


leu trp 


phe 


arg 


leu 


a rg 


pro 


a rg 


a rg 


gly 


361/121 


















391/131 










TCA TTT 


CGC 


AGC 


AAG 


CGG 


TCT 


CCG 


GGT 


cg: 


AGC ATC 


GTT 


GCG 


GCG 


ATC 


GCG 


GCG 


CAG 


TCG 


ser phe 


arg 


ser 


lys 


arg 


ser 


pro 


gly 


ar 3 


ser lie 


val 


ala 


ala 


lie 


ala 


ala 


gin 


ser 


421/141 


































TCG GAC 


GAG 


TCG 


TCG 


TCA 


ACG 


ACC 


ACG 


ATG 




















ser asp 


glu 


ser 


ser 


ser 


thr 


thr 


thr 


ile 





















SEQ ID N° 27B 



FEUILLE DE REM£L^QEjj/IE|J^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



94/185 

33/11 

TAC CAG CAA GAG CCC AGG GCT TCA CAG GAC CTA AAA GGA GTA GCG CCC ATG GGC TTG ATC 
tyr gin gin glu pro arg ala ser gin asp leu lys gly val ala pro met gly leu ile 
63/21 93/3X 

CAA TTT TCC TTC CGC CCC GTG CAA TAC CAT CTG CAA GAC CAG CGA CGG CCC GTG GTT GCG 
gin phe ser phe arg pro val gin tyr his leu gin asp gin arg arg pro val val ala 
123/41 153/51 

GTC GCG CAG CTT GCG GAA ACG GGG TAT GGA CCC TGC CGT ACC GTT GTT GCC ACT TGA TGT 
val ala gin leu ala glu thr gly tyr gly pro cys arg thr val val ala thr OPA cvs 
183/61 213/71 

CGT CGC TCT CCA CCC GTC GGG GGG CGA AAG CCA TTC CGA CAC TGG GAT CCT CAA AAC GTC 
arg arg ser pro pro val gly gly arg lys pro phe arg his trp asp pro gin asn val 
243/81 273/91 

GGC TGA GTG TCT GCA GGG CTC CGG GGA GCA GCC GAT CAT CAC CAT GTA CGA ACT GAA TAA 
gly OPA val ser ala gly leu arg gly ala ala asp his his his val arq thr qlu OCH 
303/101 333/111 

GTC CCC CCC GCG CGA CTT CCA GAC ATT TGT TGT GGT TTC GGT TGA GGC CGA GGC GAG GCT 
val pro pro ala arg leu pro asp ile cys cys gly phe gly OPA gly arg glv glu ala 
363/121 393/131 

CAT TTC GCA GCA AGC GGT CTC CGG GTC GCA GCA TCG TTG CGG CGA TCG CGG CGC AGT CGT 
his phe ala ala ser gly leu arg val ala ala ser leu arg arg ser arg arg ser arq 
423/141 y y 

CGG ACG AGT CGT CGT CAA CGA CCA CGA TC 
arg thr ser arg arg gin arg pro arg 

SEQ ID N° 27C 
FIGURE 27C 



MKT GT ATT RRRLLAVL IALALP GAA VAL LAE P S AT GAS D P CAA S EVAR 
TVGSVAKSMGDYLDSHPETNQVMTAVLQQQVGPGSVASLKAHFE1ANPK 
VASDLHALSQPLTDLSTRCSLPISGLQAIGLMQAVQGARR 

SEQ ID N° 28 
FIGURE 28 



GTGGGCAAGC AGCTAGCCGC GCTCGCCGCG CTGGTCGGTG CGTGCATGCT CGCAGCCGGA 60 

TGCACCAACG TGGTCGACGG GACCGCCGTG GCTGCCGACA AATCCGGACC ACTGCATCAG 12 0 

GATCCGATAC CGGTTTCAGC GCTTGAAGGG CTGCTTCTCG ACTTGAGCCA GATCAATGCC 180 

GCGCTGGGTG CGACATCGAT GAAGGTGTGG TTCAACGCCA AGGCAATGTG GGACTGGAGC 24 0 

AAGAGCGTGG CCGACAAGAA TTGCCTGGCT ATCGACGGTC CAGCACAGGA AAAGGTCTAT 300 

GCCGGCACCG GGTGGACCGC TATGCGCGGC CAACGGCTGG AT GAC AGC AT CGATGACTCC 3 60 

AAGAAACGCG ACCACTACGC CATTCAAGCG GTCGTCGGCT TCCCGACCGC AC AT GAT GCC 420 

GAGGAGTTCT ACAGCTCCTC GGTGCAAAGC TGGAGCAGCT GCTCGAACCG CCGGTTTGTC 4 B0 

GAAGTCACCC CCGGACAGGA CGACGCCGCC TGGACTGTGG CTGACGTTGT CAACGACAAC 54 0 

GGCATGCTCA GTAGCTCGCA G GTT CAG GAA GGCGGCGACG GATGGACCTG CCAGCGTGCC 600 

CTGACTGCGC GCAACAACGT CACTATCGAC AT TGT CAC GT GCGCCTATAG CCAACCGGAT 660 

TTGGTGGCGA TTGGCATCGC TAACCAAATC GCGGCCAAGG TTGCTAAGCA GTAG 714 



SEQ ID N° 29 
FEUILLE DE REMP£A©BMEr<rP(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



95/185 



MGKQIJUVLAALVGACMIJ\AGC™^ 
MKVWFNAKAMWDWSKSVADKNCIAIDGPAQ 

GFPTAHDAEEFYSSSVQSWSSCSKRRFVEVTFTPGQDDAAWTVADWNDNGMLSSSQVQEGGDGWTCO 
RALTARNNVTIDIVTCAYSQPDLVFTAIGIANQIAAKVAKQ 



SEQ ID N° 30 



FIGURE 30 



1/1 

AGG CGA ATA CCC GCG AGG GCA GCG CGA 
arg arg ile pro ala arg ala ala arg 
61/21 

ACA CAT CCC AGC CGC GCA CGC TTC CGG 
thr his pro ser arg ala arg phe arg 
121/41 

ACA CCA GGA TTG CGA CAA CCA AAG CCC 
thr pro gly leu arg gin pro lys pro 
181/61 

GTT CTG CCG CCT CGA TCT CAG CGC GGA 
val leu pro pro arg ser gin arg gly 



31/11 

CGG CGG CCC TGC CGG CGC CGT GGC TGC TGA ACA 
arg arg pro cys arg arg arg gly cys OPA thr 
91/31 

TAT GCG GCA GGA TAA ACG ACC CCA ACA GCA CGA 
tyr ala ala gly OCH thr thr pro thr ala arg 
151/51 

TCG CGC CTG GCT CGA TTT CGC GCG CAA CGC GGC 
ser arg leu ala arg phe arg ala gin arg qly 

211/71 
GGG CGT CGA GAT C 
gly arg arg asp 



SEQ ID N° 31A 



FIGURE 31A 



1/1 

GGC GAA TAC CCG CGA GGG CAG CGC GAC 

gly glu tyr pro arg gly gin arg asp 
61/21 

CAC ATC CCA GCC GCG CAC GCT TCC GGT 

his ile pro ala ala his ala ser gly 
121/41 

CAC CAG GAT TGC GAC AAC CAA AGC CCT 

his gin asp cys asp asn gin ser pro 
181/61 

TTC TGC CGC CTC GAT CTC AGC GCG GAG 

phe cys arg leu asp leu ser ala glu 



31/11 

GGC GGC CCT GCC GGC GCC GTG GCT GCT GAA CAA 
gly gly pro ala gly ala val ala ala glu gin 
91/31 

ATG CGG CAG GAT AAA CGA CCC CAA CAG CAC GAA 
met arg gin asp lys arg pro gin gin his glu 
151/51 

CGC GCC TGG CTC GAT TTC GCG CGC AAC GCG GCG 
arg ala trp leu asp phe ala arg asn ala ala 

211/71 
GGC GTC GAG ATC 
gly val glu ile 



SEQ ID N° 31B 



FIGURE 31B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



1/1 








GCG AAT 


ACC 


CGC 


GAG 


ala asn 


thr 


arg 


glu 


61/21 








ACA TCC 


CAG 


CCG 


CGC 


thr ser 


gin 


pro 


arg 


121/41 








ACC AGG 


ATT 


GCG 


ACA 


thr arg 


ile 


ala 


thr 


131/61 








TCT GCC 


GCC 


TCG 


ATC 


ser ala 


ala 


ser 


ile 



GGC AGC GCG ACG GCG 
gly ser ala thr ala 

ACG CTT CCG GTA TGC 
thr leu pro val cys 

ACC AAA GCC CTC GCG 
thr lys ala leu ala 

TCA GCG CGG AGG GCG 
ser ala arg arg ala 



96/185 

31/11 

GCC CTG CCG GCG CCG 
ala leu pro ala pro 
91/31 

GGC AGG ATA AAC GAC 
gly arg ile asn asp 
151/51 

CCT GGC TCG ATT TCG 
pro gly aer ile ser 
211/71 
TCG AGA TC 
ser arg 



TGG CTG CTG AAC AAC 
trp leu leu asn a3n 

CCC AAC AGC ACG AAC 
pro asn ser thr asn 

CGC GCA ACG CGG CGT 
arg ala thr arg arg 



SEQ ID N° 31C 



FIGURE 31C 



acc 
thr 


cca 
pro 


aca 
thr 


gca 
ala 


cga 
arg 


aca 
thr 


cca 
pro 


gga 
gly 


ttg cga 
leu arg 
91/31 


caa 
gin 


cca 
pro 


aag 
lys 


ccc 
pro 


teg 
ser 


cgc 
arg 


ctg 
leu 


cgc 
arg 


gcg 
ala 


caa 
gin 


cgc 
arg 


ggc 
gly 


gtt 
val 


ctg 
leu 


ccg 
pro 


cct cga 
pro arg 
151/51 


tct 
ser 


cag 
gin 


cgc 
arg 


gga 
gly 


ggg 

gly 


cgt 
arg 


cga 
arg 


cgt 
arg 


cgt 
arg 


gtt 
val 


cgt 
arg 


ggc 
gly 


tea 
ser 


tea 
ser 


tct 
ser 


gca tec 
ala ser 
211/71 


tec 
ser 


ggg 

gly 


ctt 
leu 


ggc 
gly 


cgc 
arg 


get 
ala 


gac 
asp 


gac 
asp 


ccc 
pro 


agg 
arg 


cat 
his 


gcc 
ala 


cag 
gin 


gcc 
ala 


gac 
asp 


ggc gcg 
gly ala 
271/91 


ccc 
pro 


egg 
arg 


ctg 
leu 


ccc 
pro 


ggc 
gly 


ggt gtg 
gly val 


ggc 
gly 


gcg 
ala 


ggt 
gly 


gcg 
ala 


gcg 
ala 


gtg 
val 


ggt cag 
gly gin 


gac gcc 
asp ala 


ggc 
gly 


gtc 
val 


ggc 
gly 


gat 
asp 


gag 
glu 


gtg 
val 


gtg 
val 



ORF d'apres Cole et al . (Nature 393:537-544) et contenant seq3iA 
1/1 31/11 

get 

il uiir pro enr aia arg enr pro giy leu arg gin pro lvs oro ser arn 

61/21 



121/41 
ccc cgc 
pro arc 
181/61" 
cag ccc 
gin pre 
241/81 

gtc gcc ggc gcg ggt gcg gcg gtg ggt cag gac gcc ggc gtc ggc gat gag gtg gtg c< 
val ala gly ala gly ala ala val gly gin asp ala gly val gly asD glu val val arc 
301/101 331/111 * 9 

cgc cgc ttc ggt gac ctt cgt ggt gat gac gtc gcc ggg acg cac gcg egg ctg gcc ggc 
arg arg phe gly asp leu arg gly asp asp val ala gly thr his ala arq leu ala alv 
361/121 391/131 

ggt gaa gtg cac cag gcg ccc gtc gcg cgc ccg ccc get eat gcg cgc cgt gac ggt gtc 
gly glu val his gin ala pro val ala arg pro pro ala his ala arg arq asp alv val 
421/141 451/151 

ctt gcg ccc ttc ccc ggt ggc cac cag cac etc gac ggc ctg ccc gac cag ggc gcg gtt 
leu ala pro phe pro gly gly his gin his leu asp gly leu oro asp gin gly ala val 
481/161 511/171 

ggc ttc cag cga gat ttg etc ctg cag cgc gat cag gcg ttc ata gcg ttc ctg cac aac 
gly phe gin arg asp leu leu leu gin arg asp gin ala phe ile ala phe leu his asn 
541/181 571/191 

ggc ttt egg cag ctg tec gtc gag ttg cgc ggc egg tgt ccc ggg ccg ctt gga gta ttg 
gly phe arg gin leu ser val glu leu arg gly arg cys pro gly pro leu alv val leu 
601/201 631/211 

gaa ggt aaa tgc ggc cgc gaa gcg ggc ccg gcg cac cac gtc gag cgt ggc cgc gaa gtc 
glu gly lys cys gly arg glu ala gly pro ala his his val glu arg gly arg glu val 
661/221 691/231 

etc ttc ggt etc ccc ggg gaa acc gac gat cag ate ggt ggt aat cgc ggc atg egg gat 
leu phe gly leu pro gly glu thr asp asp gin lie gly gly asn arc qly tret arq asc 
^21/241 751/251 

ggc cgc ccg cac gcg etc gat gat gcc gag gta gcg etc ggc acg ata gga ccg ccg cat 
gly arg pro his ala leu asp asp ala glu val ala leu gly thr lie gly pro oro his 
781/261 811/271 
cgc gcg cag gat ccg gtc gga tec gga ctg tag 
arg ala gin asp pro val gly ser gly leu AMB 



SEQ ID N° 31F 



FEUILLE DE REMPEAQES/1EWF(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



97/185 



1/1 


















31/11 


















aga ctg 
arg leu 
61/21 


gtg 
val 


tac 
tyr 


acg 
thr 


gag 
glu 


ace 
thr 


aag 
lys 


ctg 
leu 


aac 
asn 


teg gca 
ser ala 
91/31 


ttc 
phe 


tec 
ser 


ttc 
phe 


ggc 
gly 


ggg 

gly 


cct 
pro 


aag 
lys 


tgt 
cys 


eta gtg 
leu val 
121/ 41 


aag 
lys 


gtc 
val 


att 
ile 


cag 
gin 


aaa 
lys 


ctg 
leu 


teg 
ser 


ggc 
gly 


ttg age 
leu ser 
151/51 


ate 
ile 


aac 
asn 


egg 
arg 


ttc 
phe 


ate 
ile 


gcg 
ala 


att 
ile 


gac 
asp 


ttc gtc 
phe val 
181/61 


ggt ttc 
gly phe 


gcg 
ala 


egg 
arg 


atg 
met 


gtc 
val 


gag 
glu 


gec 
ala 


etc ggc 
leu gly 
211/71 


ggc 
gly 


gtc 
val 


gag 
glu 


gta 
val 


tgc 
cys 


age 
ser 


ace 
thr 


ace 
thr 


ccg ttg 
pro leu 
241/81 


egg 
arg 


gac 
asp 


tac 
tyr 


gaa 
glu 


ctg 
leu 


ggc 
gly 


acg 
thr 


gtg 
val 


ctg gag 
leu glu 
271/91 


cac 
his 


gee 
ala 


gga 
gly 


cgc 
arg 


cag 
gin 


gtc 
val 


att 
ile 


gac 
asp 


ggg ccg 
gly pro 
301/101 


ace 
thr 


gcg 
ala 


ctg 
leu 


aac 
asn 


tat 
tyr 


gtg 
val 


cgc 
arg 


get 
ala 


cgc cag 
arg gin 
331/111 


gtc 
val 


ace 
thr 


ace 
thr 


gag 
glu 


age 
ser 


aat 
asn 


ggc 
gly 


gac 
asp 


tac ggg 
tyr gly 


cgc 
arg 


ate 
ile 


aaa 
lys 


cgc 
arg 


cag 
gin 


cag 
gin 


ttg 
leu 


ttt 
phe 


ttg teg 
leu ser 


teg 
ser 


ctg 
leu 


ctg 
leu 


cgt 
arg 


teg 
ser 


atg 
met 


ate 

ile 





SEQ ID N° 32A 
FIGURE 32A 



1/1 


















31/11 


















gac tgg 
asp trp 
61/21 


tgt 
cys 


aca 
thr 


egg 
arg 


aga 
arg 


cca 
pro 


age 
ser 


tga 
OPA 


act 
thr 


egg cat 
arg his 
91/31 


tct 
ser 


cct 
pro 


teg 
ser 


gcg 
ala 


ggc 
gly 


eta 
leu 


agt 
ser 


gtc 
val 


tag tga 
AMB OPA 
121/41 


agg 
arg 


tea 

ser 


ttc 
phe 


aga 
arg 


aac 
asn 


tgt 
cys 


egg 
arg 


get 
ala 


tga gca 
OPA ala 
151/51 


tea 
ser 


acc 
thr 


ggt 
gly 


tea 
ser 


teg 
ser 


cga 
arg 


ttg 
leu 


act 
thr 


teg teg 
ser ser 

181/61 


gtt 
val 


teg 
ser 


cgc 
arg 


gga 
gly 


tgg 
trp 


teg 
ser 


agg 
arg 


ccc 
pro 


teg gcg 
ser ala 
211/71 


gcg 
ala 


teg 
ser 


agg 
arg 


tat 
tyr 


gca 
ala 


gca 
ala 


cca 
pro 


ccc 
pro 


cgt tgc 
arg cys 
241/81 


ggg 

gly 


act 
thr 


acg 
thr 


aac 
asn 


tgg 
trp 


gca 
ala 


egg 
arg 


tgc 
cys 


tgg age 
trp ser 
271/91 


acg 
thr 


ccg 
pro 


gac 
asp 


gee 
ala 


agg 
arg 


tea 
ser 


ttg 
leu 


acg 
thr 


ggc cga 
gly arg 
301/101 


ccg 
pro 


cgc 
arg 


tga 
OPA 


act 
thr 


atg 

met 


tgc 

cys 


gcg 
ala 


etc 
leu 


gee agg 
ala arg 
331/111 


tea 
ser 


cca 
pro 


ccg 
pro 


aga 
arg 


gca 
ala 


atg 
met 


gcg 
ala 


act 
thr 


acg ggc 
thr gly 


gca 

ala 


tea 
ser 


aac 
asn 


gee 
ala 


age 
ser 


agt 
ser 


tgt 
cys 


ttt 
phe 


tgt cgt 
cys arg 


cgc 
arg 


tgc 
cys 


tgc 
cys 


gtt 
val 


cga 
arg 


tga 
OPA 


tc 





SEQ ID N° 32B 
FIGURE 32B 



FEUILLE DE RE MP LACE ME NT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



98/185 



1/1 






act ggt 


gta 


cac 


thr gly val 


hi3 


61/21 






agt gaa 


ggt 


cat 


ser glu gly 


his 


121/41 






cgt egg 


ttt 


cgc 


arg arg phe 


arg 


181/61 






gtt gcg 


gga 


eta 


val ala 


gly 


leu 


241/81 






gec gac 


cgc 


get 


ala asp 


arg 


ala 


301/101 






egg gcg 


cat 


caa 


arg ala 


his 


gin 



gga 
gly 


gac 
a3p 


caa 
gin 


get 
ala 


tea 
ser 


gaa 
glu 


act 
thr 


gtc 
val 


gcg 
ala 


gat ggt 
asp gly 


cga 
arg 


cga 
arg 


act ggg cac 
thr gly his 


gaa 
glu 


eta 
leu 


tgt 
cys 


gcg 
ala 


acg 
thr 


cca 
pro 


gca 
ala 


gtt 
val 



31/11 
gaa etc ggc att 
glu leu gly ile 

91/31 
ggg ctt gag cat 
gly leu glu his 

151/51 
ggc cct egg egg 
gly pro arg arg 

211/71 
ggt get gga gca 
gly ala gly ala 

271/91 
cgc teg cca ggt 
arg ser pro gly 

331/111 
gtt ttt gtc gtc 
val phe val val 



SEQ ID N° 
FIGURE : 



etc ctt egg egg 
leu leu arg arg 

caa ccg gtt cat 
gin pro val his 

cgt cga ggt atg 
arg arg gly met 

cgc egg acg cca 
arg arg thr pro 

cac cac cga gag 
his his arg glu 

get get gcg ttc 
ala ala ala phe 



32C 



gec taa gtg tct 
ala OCH val ser 

cgc gat tga ctt 
arg asp OPA leu 

cag cac cac ccc 
gin his his pro 

ggt cat tga egg 
gly his OPA arg 

caa tgg cga eta 
gin trp arg leu 

gat gat c 
asp asp 



sequence Rv0822c predite par Cole et al . 
1/1 

atg agt gac ggc gag age gec gcg ccg tgg 
Met ser asp gly glu ser ala ala pro trp 
61/21 

ggt gtt gac cga tgg ate acg gta ccg ccc 
gly val asp arg trp ile thr val pro pro 
121/41 

gac acc cag aat gtc ggc tgt cat gee ace 
asp thr gin asn val gly cys his ala thr 
181/61 

agg etc ggc ccc get ttt cct gac etc ccc 
arg leu gly pro ala phe pro asp leu pro 
241/81 

cca tec ggc cgc ggc ccg aag gtc cac gac 
pro ser gly arg gly pro lys val his asp 
301/101 

ate gec ate ccg gec cac teg etc gag ttc 
ile ala ile pro ala his ser leu glu phe 
361/121 

aac tat ccg cgc gee gac cac gec cgc cgt 
asn tyr pro arg ala asp hi3 ala arg arg 
421/141 

gga teg get cga gtg egg cca ttg egg ate 
gly ser ala arg val arg pro leu arg ile 
481/161 

gcg ccg aac tec ggc egg cgc ccg atg gtg 
ala pro asn ser gly arg arg pro met val 
541/181 

gec get ctg gcg ttg gcg ctg acc ggc ggg 
ala ala leu ala leu ala leu thr gly gly 
601/201 

egg ctg aac atg gta age gcg etc gac ccg 
arg leu asn met val ser ala leu asp pro 



(Nature 393:537-544) et contenant seq 32A 
31/11 



gca egg 


etc 


tec 


gag 


tea 


gca 


ttc 


ccc 


gat 


ala arg 


leu 


ser 


glu 


ser 


ala 


phe 


pro 


asp 


91/31 
















gee aca 


tgg 


gtg 


gca 


gec 


cag 


ggt 


ccg 


egg 


ala thr 


trp 


val 


ala 


ala 


gin 


gly 


pro 


arg 


151/51 
















ggc gee 


gtt 


agt 


gtg 


gec 


gat 


ctg 


ate 


gec 


gly ala 


val 


ser 


val 


ala 


asp 


leu 


ile 


ala 



211/71 

acg cac cgc cat gtc gee ccc gaa ccc gag 
thr hi3 arg his val ala pro glu pro glu 
271/91 

gac gec gac gac cag cag gac acc gag get 
asp ala asp asp gin gin asp thr glu ala 
331/111 

etc teg gag ctt ccc gac etc egg gca gec 
leu ser glu leu pro asp leu arg ala ala 
391/131 

gaa ccc gag eta ccc ggc aag cag eta acc 
glu pro glu leu pro gly lys gin leu thr 
451/151 

cgc cga acg teg ccc gcg ccc gee aag cca 
arg arg thr ser pro ala pro ala lys pro 
511/171 

ctg gec gcg cgc teg ctg gcg get ctg ttt 
leu ala ala arg ser leu ala ala leu phe 
571/191 

gca tgg cag tgg age gcg teg aag aac age 
ala trp gin trp ser ala ser lys asn ser 
631/211 

cat teg ggc gac ate gtc aac ccc age ggg 
his ser gly asp ile val asn pro ser gly 



SEQ ID N° 32D 



FEU1LLE DE REMP£^§filE^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



99/185 



661/221 

cag cat ggc gac gag aac ttc ttg etc gtc 
gin his gly asp glu asn phe leu leu val 
721/241 

aat ate ggc gec ggc gac gec gag gac gec 
asn ile gly ala gly asp ala glu asp ala 
781/261 

gtc aac att ccg gec age cgc gag egg gtc 
val asn ile pro ala ser arg glu arg val 
841/281 

ate act cca ate caa tgc gag gcg tgg aac 
ile thr pro ile gin cy3 glu ala trp asn 
901/301 

gac gag aag acg gga acg atg ggt ccc aga 
asp glu lys thr gly thr met gly pro arg 
961/321 

gca ttc tec ttc ggc ggg cct aag tgt eta 
ala phe ser phe gly gly pro lys cys leu 
1021/341 

age ate aac egg ttc ate gcg att gac ttc 
ser ile asn arg phe ile ala ile asp phe 
1081/361 

ggc ggc gtc gag gta tgc age acc acc ccg 
gly gly val glu val cys ser thr thr pro 
1141/381 

gag cac gec gga cgc cag gtc att gac ggg 
glu his ala gly arg gin val ile asp gly 
1201/401 

cag gtc acc acc gag age aat ggc gac tac 
gin val thr thr glu ser asn gly asp tyr 
1261/421 

teg teg ctg ctg cgt teg atg ate teg acg 
ser ser leu leu arg ser met ile ser thr 
1321/441 

aac gtc gtc aac atg ttc ate ggt aac age 
asn val val asn met phe ile gly asn ser 
1381/461 

gtc gaa etc ggt cga teg ttg cag cat atg 
val glu leu gly arg ser leu gin his met 
1441/481 

ccg acc ggt ata acc gac cag aac ggc gac 
pro thr gly ile thr asp gin asn gly asp 
1501/501 

ctt ttc acc gec ate ate gac gac gat ccg 
leu phe thr ala ile ile asp asp asp pro 
1561/521 

cgt ctg ggc aac acg ccg teg acc ccg ccg 
arg leu gly asn thr pro ser thr pro pro 
1621/541 

ctg acc aac gag att cag cac cag cag gtt 
leu thr asn glu ile gin his gin gin val 
1681/561 

cag gtc tct aac teg acc ggc cag gec ggt 
gin val ser asn ser thr gly gin ala gly 
1741/581 

egg aac ggc ttc aac gtg atg get ccg gac 
arg asn gly phe asn val met ala pro asp 
1801/601 

gtg ttt ttt teg ccc ggc aac gaa cag get 
val phe phe ser pro gly asn glu gin ala 
1861/621 

tea aag ate gag egg gtg acc ggg ate ggc 
ser lys ile glu arg val thr gly ile gly 



691/231 
















ggt atg gac 


tct 


cgt 


gee 


ggg 


gcg 


aac 


gec 


gly met asp 


ser 


arg 


ala 


gly 


ala 


asn 


ala 


751/251 
















ggc ggc gca 


cgt 


teg 


gac 


acc 


gtc 


atg 


ctg 


gly gly ala 


arg 


ser 


asp 


thr 


val 


met 


leu 


811/271 
















gtc gcg gtg 


teg 


ttc 


ccc 


cgc 


gac 


ctg 


gcg 


val ala val 


ser 


phe 


pro 


arg 


asp 


leu 


ala 


871/291 
















ccc gag acc 


ggt 


aag 


tac 


gga 


ccc 


ate 


tac 


pro glu thr 


gly 


lys 


tyr 


gly pro 


ile 


tyr 


931/311 
















ctg gtg tac 


acg 


gag 


acc 


aag 


ctg 


aac 


teg 


leu val tyr 


thr 


glu 


thr 


lys 


leu 


asn 


ser 


991/331 
















gtg aag gtc 


att 


cag 


aaa 


ctg 


teg 


ggc 


ttg 


val lys val 


ile 


gin 


lys 


leu 


ser 


gly 


leu 


1051/351 














gtc ggt ttc 


gcg 


egg 


atg 


gtc 


gag 


gee 


etc 


val gly phe 


ala 


arg 


met 


val 


glu 


ala 


leu 


llll/37l' 
















ttg egg gac 


tac 


gaa 


ctg 


ggc 


acg 


gtg 


ctg 


leu arg asp 


tyr 


glu 


leu 


gly 


thr 


val 


leu 


1171/391 
















ccg acc gcg 


ctg 


aac 


tat 


gtg 


cgc 


get 


cgc 


pro thr ala 


leu 


asn 


tyr 


val 


arg 


ala 


arg 


1231/411 














ggg cgc ate 


aaa 


cgc 


cag 


cag 


ttg 


ttt 


ttg 


gly arg ile 


lys 


arg 


gin 


gin 


leu 


phe 


leu 


1291/431 














gac acc ttg 


ttc 


aac 


etc 


age 


agg 


etc 


aac 


a3p thr leu 


phe 


asn 


leu 


ser 


arg 


leu 


asn 


1351/4 51 














tac gtg gac 


aac 


gtc 


aag 


acc 


aaa 


gac 


ctg 


tyr val asp 


asn 


val 


lys 


thr 


lys 


asp 


leu 


1411/471 














gcg gee ggg 


cac 


gtc 


acg 


ttc 


gtg 


acc 


gtt 


ala ala gly 


his 


val 


thr 


phe 


val 


thr 


val 


1471/491 
















gag ccc ccg 


cgt 


acc 


tec 


gac 


atg 


aag 


gcg 


glu pro pro 


arg 


thr 


ser 


asp 


met 


lys 


ala 


1531/511 














ctg ccc ctg 


gaa 


aac 


gat 


cac 


aac 


gec 


cag 


leu pro leu 


glu 


asn 


asp 


his 


asn 


ala 


gin 


1591/531 














acc acc acc 


aag 


aag 


gcg 


ccg 


cag 


gcg 


ggt 


thr thr thr 


lys 


lys 


ala 


pro 


gin 


ala 


gly 


1651/551 
















acg acg acc 


teg 


cca 


aaa 


gag 


gtc 


aca 


gtg 


thr thr thr 


ser 


pro 


lys 


glu 


val 


thr 


val 


1711/571 
















ttg gec acc 


acc 


gee 


acc 


gat 


cag 


etc 


aag 


leu ala the 


thr 


ala 


thr 


asp 


gin 


leu 


lys 


1771/591 
















gac tac ccg 


agt 


teg 


ctg 


ctg 


gec 


acc 


aca 


asp tyr pr:> 


ser 


ser 


leu 


leu 


ala 


thr 


thr 


1831/611 
















gec gec a:: 


gtg 


gec 


gec 


gtg 


ttc 


ggc 


cag 


ala ala thr 


val 


ala 


ala 


val 


phe 


gly 


gin 


1891/631 














caa ctg gtc 


cag 


gtg 


gtg 


ctg 


ggc 


caa 


gac 


gin leu val 


gin 


val 


va 1 


leu 


gly 


gin 


asp 



SEQ ID N° 32D (suite 1) 



FEUILLE DE l?ER#5^EWfaE&LE 26) 



WO 99/09186 



PCT/FR98/01813 



100/185 



1921/641 

ttc age gcg gtg cgc 
phe ser ala val arg 
1981/661 

aac tec tec age cca 
asn ser ser ser pro 
2041/681 

acc ace tgc gag tag 
thr thr cys glu AMB 



get ccc ctg ccg agt 
ala pro leu pro ser 

ccg acc aag ctg ccc 
pro thr lys leu pro 



1951/651 

ggc tec acc gtc age 
gly ser thr val ser 
2011/671 

gag gac ctg acg gtc 
glu asp leu thr val 



gtg cag ata age cgc 
val gin ile ser arg 

acc aac gec gee gac 
thr asn ala ala asp 



SEQ ID N° 32D (suite 2) 
FIGURE 32D (suite 2) 



ORF d'apres 


Colt 


1/1 






tag gac 


atg 


agt 


AMB asp 


met 




61/21 






ccc gat 


ggt 


att 


pro asp 


gly 


val 


121/41 






ccg egg 


gac 


acc 


pro arg 


asp 


thr 


181/61 






ate gec 


agg 


etc 


ile ala 


arg 


leu 


241/81 






ccc gag 


cca 


tec 


pro glu 


pro 


ser 


301/101 






gag get 


ate 


gec 


glu ala 


ile 


ala 


361/121 






gca gec 


aac 


tat 


ala ala 


asn 


tyr 


421/141 






eta acc 


gga 


teg 


leu thr 


gly 


ser 


481/161 






aag cca 


gcg 


ccg 


lys pro 


ala 


pro 


541/181 






ctg ttt 


gec 


get 


leu phe 


ala 


ala 


601/201 






aac age 


egg 


ctg 


asn ser 


arg 


leu 


661/221 






age ggg 


cag 


cat 


ser gly 


gin 


hi 3 


721/241 






aac gec 


aat 


ate 


asn ala 


asn 


ile 


731/261 






atg ctg 


gtc 


aac 


met leu 


val 


asn 



et al. (Nature 



gac ggc gag age 
asp gly glu ser 

gac cga tgg ate 
asp arg trp ile 

cag aat gtc ggc 
gin asn val gly 

ggc ccc get ttt 
gly pro ala phe 

ggc cgc ggc ccg 
gly arg gly pro 

ate ccg gec cac 
ile pro ala his 

ccg cgc gec gac 
pro arg ala asp 

get cga gtg egg 
ala arg val arg 

aac tec ggc egg 
asn ser gly arg 

ctg gcg ttg gcg 
leu ala leu ala 

aac atg gta age 
asn met val ser 

ggc gac gag aac 
gly asp glu asn 

ggc gec ggc gac 
gly ala gly asp 

att ccg gec age 
lie pro ala ser 



393:537-544) et 

31/11 
gec gcg ccg tgg 
ala ala pro trp 

91/31 
acg gta ccg ccc 
thr val pro pro 

151/51 
tgt cat gec acc 
cys his ala thr 

211/71 
cct gac etc ccc 
pro asp leu pro 

271/91 
aag gtc cac gac 
ly3 val his asp 

331/111 
teg etc gag ttc 
ser leu glu phe 

391/131 
cac gec cgc cgt 
his ala arg arg 

451/151 
cca ttg egg ate 
pro leu arg ile 

511/171 
cgc ccg atg gtg 
arg pro met val 

571/191 
ctg acc ggc ggg 
leu thr gly gly 

631/211 
gcg etc gac ccg 
ala leu asp pro 

691/231 
ttc ttg etc gtc 
phe leu leu val 

751/251 
gec gag gac gec 
ala glu asp ala 

811/271 
cgc gag egg gtc 
arg glu arg val 



SEQ ID N 



contenant 



gca egg etc tec 
ala arg leu ser 

gec aca tgg gtg 
ala thr trp val 

ggc gec gtt agt 
gly ala val ser 

acg cac cgc cat 
thr his arg his 

gac gec gac gac 
asp ala asp asp 

etc teg gag ctt 
leu ser glu leu 

gaa ccc gag eta 
glu pro glu leu 

cgc cga acg teg 
arg arg thr ser 

ctg gee gcg cgc 
leu ala ala arg 

gca tgg cag tgg 
ala trp gin trp 

cat teg ggc gac 
his ser gly asp 

ggt atg gac tct 
gly met asp ser 

ggc ggc gca cgt 
gly gly ala arg 

gtc gcg gtg ccg 
val ala val ser 



32F 



gag tea gca ttc 
glu ser ala phe 

gca gee cag ggt 
ala ala gin gly 

gtg gee gat ctg 
val ala asp leu 

gtc gec ccc gaa 
val ala pro glu 

cag cag gac acc 
gin gin asp thr 

ccc gac etc egg 
pro asp leu arg 

ccc ggc aag cag 
pro gly lys gin 

ccc gcg ccc gec 
pro ala pro ala 

teg ctg gcg get 
3er leu ala ala 

age gcg teg aag 
ser ala ser lys 

ate gtc aac ccc 
lie val asn pro 

cgt gec ggg gcg 
arg ala gly ala 

teg gac acc gtc 
ser asp thr val 

ttc ccc cgc gac 
phe pro arg asp 



FEUILLE DE REM^gEMEJ^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



841/281 
















ctg gcg ate 


act 


cca 


ate 


caa 


tgc 


gag 


gcg 


leu ala ile 


thr 


pro 


ile 


gin 


cys 


glu 


ala 


901/301 
















ate tac gac 


gag 


aag 


acg 


gga 


acg 


atg 


ggt 


ile tyr asp 


glu 


lys 


thr 


gly 


thr 


met 


gly 


961/321 














aac teg gca 


ttc 


tec 


ttc 


ggc 


ggg 


cct 


aag 


asn ser ala 


phe 


ser 


phe 


gly gly 


pro 


lys 


1021/341 














ggc ttg age 


ate 


aac 


egg 


ttc 


ate 


gcg 


att 


gly leu ser 


ile 


asn 


arg phe 


ile 


ala 


ile 


1081/361 
















gec etc ggc 


ggc 


gtc 


gag 


gta 


tgc 


age 


acc 


ala leu gly 


gly 


val 


glu val 


cys 


3er 


thr 


1141/381 
















gtg ctg gag 


cac 


gec 




cgc 


cag 


gtc 


att 


val leu glu 


his 


ala 


gly 


arg 


gin val 


ile 


1201/401 
















get cgc cag 


gtc 


acc 


acc 


gag 


age 


aat 


ggc 


ala arg gin 


val 


thr 


thr 


glu 


ser 


asn 


gly 


1261/421 














ttt ttg teg 


teg 


ctg 


ctg 


cgt 


teg 


atg 


ate 


phe leu ser 


ser 


leu 


leu 


arg 


ser 


met 


lie 


1321/441 
















etc aac aac 


gtc 


gtc 


aac 


atg 


ttc 


ate 


ggt 


leu asn asn 


val 


val 


asn 


met 


phe 


lie 


gly 


1381/461 














gac ctg gtc 


gaa 


etc 


ggt 


cga 


teg 


ttg 


cag 


asp leu val 


glu 


leu 


gly arg 


ser 


leu 


gin 


1441/481 














acc gtt ccg 


acc 


ggt 


ata 


acc 


gac 


cag 


aac 


thr val pro 


thr 


gly 


ile 


thr 


asp 


gin 


asn 


1501/501 














aag gcg ctt 


ttc 


acc 


gec 


ate 


ate 


gac 


gac 


lys ala leu 


phe 


thr 


ala 


ile 


ile 


asp 


asp 


1561/521 












gec cag cgt 


ctg 


ggc 


aac 


acg 


ccg 


teg 


acc 


ala gin arg 


leu 


gly 


asn 


thr 


pro 


ser 


thr 


1621/541 
















gcg ggt ctg 


acc 


aac 


gag 


att 


cag 


cac 


cag 


ala gly leu 


thr 


asn 


glu 


ile 


gin 


his 


gin 


1681/561 














aca gtg cag 


gtc 


tct 


aac 


teg 


acc 


ggc 


cag 


thr val gin 


val 


ser 


asn 


ser 


thr 


gly 


gin 


1741/581 














etc aag egg 


aac 


ggc 


ttc 


aac 


gtg 


atg 


get 


leu lys arg 


asn 


gly 


phe 


asn 


val 


met 


ala 


1901/601 
















acc aca gtg 


ttt 


ttt 


teg 


ccc 


ggc 


aac 


gaa 


thr thr val 


phe 


phe 


ser 


pro 


gly 


asn 


glu 


1861/621 
















ggc cag tea 


aag 


ate 


gag 


egg 


gtg 


acc 


ggg 


gly gin ser 


lys 


ile 


glu 


arg 


val 


thr 


gly 


1921/641 
















caa gac ttc 


age 


gcg 


gtg 


cgc 


get 


ccc 


ctg 


gin asp phe 


ser 


ala 


val 


arg 


ala 


pro 


leu 


1981/661 
















age cgc aac 


tec 


tec 


age 


cca 


ccg 


acc 


aag 


ser arg asn 


ser 


ser 


ser 


pro 


pro 


thr 


lys 


2041/681 














gec gac ace 


acc 


tgc 


gag 


tag 








ala asp thr 


thr 


cys 


glu 


AMB 









101/185 

871/291 

tgg aac ccc gag acc ggt aag tac gga ccc 
trp asn pro glu thr gly lys tyr gly pro 
931/311 

ccc aga ctg gtg tac acg gag acc aag ctg 
pro arg leu val tyr thr glu thr lys leu 
991/331 

tgt eta gtg aag gtc att cag aaa ctg teg 
cys leu val lys val ile gin lys leu ser 
1051/351 

gac ttc gtc ggt ttc gcg egg atg gtc gag 
asp phe val gly phe ala arg met val glu 
1111/371 

acc ccg ttg egg gac tac gaa ctg ggc acg 
thr pro leu arg asp tyr glu leu gly thr 
1171/391 

gac ggg ccg acc gcg ctg aac tat gtg cgc 
asp gly pro thr ala leu asn tyr val arg 
1231/411 

gac tac ggg cgc ate aaa cgc cag cag ttg 
asp tyr gly arg ile lys arg gin gin leu 
1291/431 

teg acg gac acc ttg ttc aac etc age agg 
ser thr asp thr leu phe asn leu ser arg 
1351/451 

aac age tac gtg gac aac gtc aag acc aaa 
asn ser tyr val asp asn val lys thr lys 
1411/471 

cat atg gcg gee ggg cac gtc acg ttc gtg 
his met ala ala gly his val thr phe val 
1471/491 

ggc gac gag ccc ccg cgt acc tec gac atg 
gly asp glu pro pro arg thr ser asp met 
1531/511 

gat ccg ctg ccc ctg gaa aac gat cac aac 
a3p pro leu pro leu glu asn asp his asn 
1591/531 

ccg ccg acc acc acc aag aag gcg ccg cag 
pro pro thr thr thr lys lys ala pro gin 
1651/551 

cag gtt acg acg acc teg cca aaa gag gtc 
gin val thr thr thr ser Dro lys glu val 
1711/571 

gee ggt ttg gec acc acc gec acc gat cag 
ala gly leu ala thr thr ala thr asD gin 
1771/591 

ccg gac gac tac ccg agt teg ctg ctg gee 
pro asp asp tyr pro ser ser leu leu ala 
1831/611 

cag get gec gee acc gtg gec gec gtg ttc 
gin ala ala ala thr val ala ala val ph<* 
1891/631 

ate ggc caa ctg gtc cag gtg gtg ctg ggc 
ile gly gin leu val gin val val leu glv 
1951/651 

ccg agt ggc tec acc gtc age gtg cag ata 
pro ser gly ser thr val ser val gin il« 
2011/671 

ctg ccc gag gac ctg acg gtc acc aac gec 
leu pro glu asp leu thr val thr asn ala 



SEQ ID 32F (suite 1) 



FEUILLE EtmpffiEteWfa&Z 26) 



WO 99/09186 



PCT/FR98/01813 



102/185 



1/1 

CGT CAC CTC TGC CAT GGT CCA 
arg his leu cys his gly pro 
61/21 

CAT GCA GAG TCG GTG TTC GCT 
his ala glu ser val phe ala 
121/41 

GGC CGA CAT TCG CCC GAG GCC 
gly arg his ser pro glu ala 
181/61 

ATT GAT ACG ATT GCG CAC ATG 
ile asp thr ile ala his met 



31/11 

TCT ACG GTA TCT GCG ACA AGG 
ser thr val ser ala thr arg 
91/31 

TCA CGC GAA CTA GGC GCG CCT 
ser arg glu leu gly ala pro 
151/51 

TTG GCC TCC ATC ACC TAA TTG 
leu ala ser ile thr OCK leu 

211/71 
GCT ATC TGG GAT C 
ala ile trp asp 



GCA GCG TCG ATC CCT CGA 
ala ala ser ile pro arg 

AGC CTG GAC GAG TCC CCG 
ser leu asp glu ser pro 

TGT GCA AAA CCG TAT CTA 
cys ala lys pro tyr leu 



SEQ ID N° 33A 



FIGURE 33A 



1/1 

GTC ACC TCT GCC ATG GTC CAT 
val thr ser ala met val his 
61/21 

ATG CAG AGT CGG TGT TCG CTT 
met gin ser arg cys ser leu 
121/41 

GCC GAC ATT CGC CCG AGG CCT 
ala asp ile arg pro arg pro 
181/61 

TTG ATA CGA TTG CGC ACA TGG 
leu ile arg leu arg thr trp 









31/11 






CTA 


CGG 


TAT 


CTG CGA 


CAA 


GGG 


leu 


arg 


tyr 


leu arg 


gin 


gly 








91/31 






CAC 


GCG 


AAC 


TAG GCG 


CGC 


CTA 


his 


ala 


asn 


AMB ala 


arg 


leu 








151/51 






TGG 


CCT 


CCA 


TCA CCT 


AAT 


TGT 


trp 


pro 


pro 


ser pro 


asn 


cys 








211/71 






CTA 


TCT 


GGG 


ATC 






leu 


ser 


gly 


ile 







SEQ ID N° 33B 
FIGURE 33B 



CAG CGT CGA TCC CTC GAC 
gin arg arg ser leu asp 

GCC TGG ACG AGT CCC CGG 
ala trp thr ser pro arg 

GTG CAA AAC CGT ATC TAA 
val gin asn arg ile OCH 



1/1 

CCG TCA CCT CTG CCA TGG TCC ATC TAC 
pro ser pro leu pro trp ser ile tyr 
61/21 

ACA TGC AGA GTC GGT GTT CGC TTC ACG 
thr cys arg val glv val arg Dhe thr 
121/41 

GGG CCG ACA TTC GCC CGA GGC CTT GGC 
gly pro thr phe ala arg gly leu glv 
181/61 

AAT TGA TAC GAT TGC GCA CAT GGC TAT 
asn OPA tyr asp cys ala his gly tyr 



31/11 

GGT ATC TGC GAC AAG GGC AGC GTC GAT CCC TCG 
gly ile cys asp lys gly ser val aso oro ser 
91/31 

CGA ACT AGG CGC GCC TAG CCT GGA CGA GTC CCC 
arg thr arg arg ala AMB oro glv arc; val o^o 
151/51 

CTC CAT CAC CTA ATT GTG TGC AAA ACC GTA TCC 
leu his his leu ile val cys lys thr val s-r 

211/71 
CTG GGA TC 
leu gly 



SEQ ID N° 33C 



FIGURE 33C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



103/185 



sequence Rvl044 predite par Cole et al. 
1/1 

ttg tgt gca aaa ccg tat eta att gat acg 

leu cys ala lys pro tyr leu ile asp thr 
61/21 

gtc gag gtt gec gec gag caa cat ggc tac 

val glu val ala ala glu gin his gly tyr 
121/41 

gtc gac cct gtg cag etc cgc etc eta gcg 

val asp pro val gin leu arg leu leu ala 
181/61 

ggt gtg tac egg gtg ccc gtg ctg ccg cgt 

gly val tyr arg val pro val leu pro arg 
241/81 

teg tgg act ttg ggg cgt ggc gtt ate teg 

ser trp thr leu gly arg gly val ile ser 
301/101 

get gac gtg aac ccg teg cgc ate cat etc 

ala asp val asn pro ser arg ile his leu 
361/121 

gee ggg ggc gag ctg tac cga gtt cac cgc 

ala gly gly glu leu tyr arg val his arg 
421/141 

gtc gac gga ata ccc gtc acg acg gtt gcg 

val asp gly ile pro val thr thr val ala 
481/161 

acg gat cct tat cag ctt egg gec gcg ate 

thr asp pro tyr gin leu arg ala ala ile 
541/181 

cgt ggg tea gca get gag eta cgc get gcg 

arg gly ser ala ala glu leu arg ala ala 
601/201 

egg ccg aag cga gca teg gcg tga 

arg pro lys arg ala ser ala OPA 



(Nature 393:537-544) et contenant seq33A 



31/11 



att gcg 
ile ala 
91/31 


cac 

his 


atg 
met 


get 
ala 


ate 
ile 


tgg 
trp 


gat 
asp 


cgc 
arg 


etc 
leu 


gtc acg 
val thr 
151/51 


act 
thr 


cgc 
arg 


gat 
asp 


gcg 
ala 


cga 
arg 


gac 
asp 


ate 
ile 


ggc 
gly 


ggg cgc 
gly arg 
211/71 


gga 
gly 


cgt 
arg 


ctt 
leu 


gag 
glu 


cgt 
arg 


gtc 
val 


ggc 
gly 


cga 
arg 


ggt gag 
gly glu 
271/91 


cac 
his 


gac 
asp 


gat 
asp 


etc 
leu 


gca 
ala 


gee 
ala 


gca 
ala 


gtg 
val 


cat gag 
his glu 
331/111 


teg 

ser 


gec 
ala 


ttg 
leu 


gcg 
ala 


ctt 
leu 


cat 
his 


gec 
ala 


etc 
leu 


acc gtc 
thr val 
391/131 


ccg 
pro 


cgc 
arg 


aac 
asn 


aac 
asn 


cat 
his 


ccg 
pro 


cgt 
arg 


gcg 
ala 


cgc gac 
arg asp 
451/151 


etc 
leu 


cag 
gin 


gca 
ala 


gee 
ala 


cac 
his 


gtc 
val 


act 
thr 


teg 
ser 


cgc acc 
arg thr 
511/171 


ate 
lie 


aaa 

lys 


gac 
asp 


tgc 
cys 


gtg 
val 


aag 
lys 


acg 
thr 


ggc 

gly 


gag cga 
glu arg 
571/191 


gec 
ala 


gaa 
glu 


gee 
ala 


gag 
glu 


ggc 
gly 


acg 
thr 


ctt 
leu 


cgt 
arg 


etc gat 
leu asp 


gag 
glu 


acc 
thr 


act 
thr 


gec 
ala 


gga 
gly 


tta 
leu 


cgc 
arg 


get 
ala 



SEQ ID N° 33D 
FIGURE 33D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



104/185 

ORF d'apres Cole et al . (Nature 393:537-544) et contenant Rvl044 



1/1 31/11 



taa ttg 


tgt 


gca 


aaa 


ccg 


tat 


eta 


att 


gat 


acg att 




cac 


a tg 


net' 


ate 


tgg 


y a u 


cgc 


OCH leu 


cys 


ala 


lys 


pro 


tyr 


leu 


ile 


asp 


thr ile 


ala 


his 


met 


al a 


ile 




asp 


arg 


61/21 


















91/31 












etc gtc 


gag 


gtt 


gec 


gec 


gag 


caa 


cat 


ggc 


tac gtc 


acg 


act 


cgc 


aa t 


aca 


cga 


gac 


ate 


leu val 


glu 


val 


ala 


ala 


glu 


gin 


his 


gly 


tyr val 


thr 


thr 


ara 


asp 


ala 


arg 


asp 


ile 


121/41 


















151/51 














ggc gtc 


gac 


cct 


gtg 


cag 


etc 


cgc 


etc 


eta 


gcg ggg 


CQC 


qaa 


cgt 


ctt 




cgt 




ggc 


gly val 


asp 


pro 


val 


gin 


leu 


arg 


leu 


leu 


ala gly 


arg 


giy 


ara 


1 eu 


glu 


arg 


vai 


y x y 


181/61 


















211/71 
















cga ggt 


gtg 


tac 


egg 


gtg 


ccc 


gtg 


ctg 


ccg 


cgt ggt 


gag 


cac 


aac 


gat 


etc 


gca 


gec 


gca 


arg gly val 


tyr 


arg 


val 


pro 


val 


leu 


pro 


arg gly 


glu 


his 


asp 


asp 


leu 


ala 


ala 


ala 


241/81 


















271/91 














gtg teg 


tgg 


act 


ttg 


ggg 


cgt 


ggc 


gtt 


ate 


teg cat 


gag 


teg 


gec 


ttq 


gcg 


ctt 


cat 


gec 


val ser 


trp 


thr 


leu 


giy 


arg 


gly 


val 


ile 


ser his 


glu 


ser 


ala 


leu 


ala 


leu 


his 


ala 


301/101 


















331/111 


















etc get 


gac 


gtg 


aac 


ccg 


teg 


cgc 


ate 


cat 


etc acc 


gtc 


ccg 


cgc 


aac 


aac 


cat 


ccg 


cgt 


leu ala 


asp 


val 


asn 


pro 


ser 


arg 


ile 


his 


leu thr 


val 


pro 


arq 


asn 


asn 


his 


pro 


arg 


JDl/ L/L 1 


















391/131 














gcg gec 




ggc 


gag 


ctg 


tac 


cga 


gtt 


cac 


cgc cgc 


gac 


etc 


cag 


gca 


gee 


cac 


gtc 


act 


aid a .L a 


gly 


gly 


glu 


leu 


tyr 


arg 


val 


his 


arg arg 


asp 


leu 


gin 


ala 


ala 


his 


val 


thr 


A O 1 / 1 A 1 
4^1/ 141 


















451/151 
















uCg y lC 


gac 


gga 


ata 


ccc 


gtc 


acg 


acg 


gtt 


gcg cgc 


acc 


ate 


aaa 


gac 


tgc 


gtg 


aag 


acg 


ser val 


asp 


dl V 


ile 


pro 


val 


thr 


thr 


val 


ala arg 


thr 


x i e 


lys 


asp 


cys 


val 


lys 


thr 


4 0 1/ 1 Dl 


















511/171 












j~Y /"f ^ 

g^C dCy 


yd L 


cct 


tat 


cag 


ctt 


egg 


gee 


gcg 


ate gag 


cga 


gec 


gaa 


gec 


gag 


ggc 


acg 


ctt 


gly thr 


asp 


pro 


tyr 


gin 


leu 


arg 


ala 


ala 


ile glu 


arg 


ala 


glu 


ala 


glu 


y x y 


thr 


leu 


541/ lol 


















571/191 














cgt cgt 


ggg 


tea 


gca 


get 


gag 


eta 


cgc 


get 


gcg etc 


gat 


gag 


acc 


act 


gee 


gga 


tta 


cgc 


arg arg 


gly 


ser 


ala 


ala 


glu 


leu 


arg 


ala 


ala leu 


asp 


glu 


thr 


thr 


ala 


gly 


leu 


arg 


601/201 
































get egg 


ccg 


aag 


cga 


gca 


teg 


gcg 


tga 






















ala arg 


pro 


lys 


arg 


ala 


ser 


ala 


OPA 




































SEQ ID 


N° 33F 






























FIGURE 33F 


















1/1 


















31/11 


















ATC CAA 


CCT 


GCT 


GGG 


CCT 


GCG 


CCT 


TCG 


AAT 


CGA CGG 


CCA 


GGC 


CAC 


CGC 


TCG 


CTG 


CCG 


GCA 


ile gin 


pro 


ala 


gly 


pro 


ala 


pro 


ser 


asn 


arg arg 


pro 


gly 


his 


arg 


ser 


leu 


pro 


ala 


61/21 


















91/31 
















ACA ACA 


CCT 


GGA 


ATG 


GGG 


ACC 


TTT 


TCG 


GTG 


TTG CTG 


GTA 


ACC 


GGG 


ACA 


ACC 


GGC 


ACC 


ACG 


thr thr 


pro 


gly 


met 


gly 


thr 


phe 


ser 


val 


leu leu 


val 


thr 


gly 


thr 


thr 


gly 


thr 


thr 


121/41 


















151/51 
















CCT CGG 


TCG 


AGA 


CGT 


ATC 


GCG 


GCA 


GCG 


TTG 


GCC CTG 


TCG 


TTG 


CTG 


ACA 


ATT 


ACC 


GCT 


GGC 


pro arg 


ser 


arg 


arg 


ile 


ala 


ala 


ala 


leu 


ala leu 


ser 


leu 


leu 


thr 


lie 


thr 


ala 


gly 


181/61 


















211/71 
















CGC CGC 


ATA 


TTT 


GCC 


GCG 


CTG 


CCG 


CGG 


GCC 


GGA TC 


















arg arg 


lie 


phe 


ala 


ala 


leu 


pro 


arg 


ala 


gly 



















SEQ ID N° 34A 



FEUILLE DE REMp15SSeW(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



105/185 



1/1 31/11 



TCC AAC 


CTG 


CTG 


GGC 


CTG 


CGC 


CTT 


CGA 


ATC 


GAC GGC 


CAG 


GCC 


ACC 


GCT 


CGC 


TGC 


CGG 


CAA 


ser asn 


leu 


leu 


gly 


leu 


arg 


leu 


arg 


ile 


asp gly 


gin 


ala 


thr 


ala 


arg 


cys 


arg 


gin 


61/21 


















91/31 












CAA CAC 


CTG 


GAA 


TGG 


GGA 


CCT 


TTT 


CGG 


TGT 


TGC TGG 


TAA 


CCG 


GGA 


CAA 


CCG 


GCA 


CCA 


CGC 


gin his 


leu 


glu 


trp 


gly pro 


phe 


arg 


cys 


cys trp 


OCH 


pro 


gly 


gin 


pro 


ala 


pro 


arg 


121/41 


















151/51 












CTC GGT 


CGA 


GAC 


GTA 


TCG 


CGG 


CAG 


CGT 


TGG 


CCC TGT 


CGT 


TGC 


TGA 


CAA 


TTA 


CCG 


CTG 


GCC 


leu gly 


arg 


asp 


val 


ser 


arg 


gin 


arg 


trp 


pro cys 


arg 


cys 


OPA gin 


leu 


pro 


leu 


ala 


181/61 


















211/71 
















GCC GCA 


TAT 


TTG 


CCG 


CGC 


TGC 


CGC 


GGG 


CCG 


GAT C 


















ala a 1 a. 


tyr 


leu 


P £® 


arg 


cys 


arg 


gly 


pro 


asp 
































SEQ ID 


N° 34B 






























FIGURE 34B 


















1/1 


















31/11 


















GAT CCA 


ACC 


TGC 


TGG 


GCC 


TGC 


GCC 


TTC 


GAA 


TCG ACG 


GCC 


AGG 


CCA 


CCG 


CTC 


GCT 


GCC 


GGC 


asp pro 


thr 


cys 


trp 


ala 


cys 


ala 


phe 


glu 


ser thr 


ala 


arg 


pro 


pro 


leu 


ala 


ala 


gly 


61/21 


















91/31 














AAC AAC 


ACC 


TGG 


AAT 


GGG 


GAC 


CTT 


TTC 


GGT 


GTT GCT 


GGT 


AAC 


CGG 


GAC 


AAC 


CGG 


CAC 


CAC 


asn asn 


thr 


trp 


asn 


gly 


asp 


leu 


phe 


gly 


val ala 


gly 


asn 


arg 


asp 


asn 


arg 


his 


his 


121/41 


















151/51 










GCC TCG 


GTC 


GAG 


ACG 


TAT 


CGC 


GGC 


AGC 


GTT 


GGC CCT 


GTC 


GTT 


GCT 


GAC 


AAT 


TAC 


CGC 


TGG 


ala ser 


val 


glu 


thr 


tyr 


arg 


gly 


ser 


val 


gly pro 


val 


val 


ala 


asp 


asn 


tyr 


arg 


trp 


181/61 


















211/71 










CCG CCG 


CAT 


ATT 


TGC 


CGC 


GCT 


GCC 


GCG 


GGC 


CGG ATC 


















pro pro 


his 


ile 


cys 


arg 


ala 


ala 


ala 


gly 


arg ile 



















SEQ ID N° 34C 
FIGURE 34C 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCIYFR98/01813 



106/185 

ORF d'apres Cole et al . (Nature 393:537-544) contennant seq34A 



1/1 31/11 



tag ccg 


cag 


ggc 


cct 


gcg 


get 


agg 


cgc 


ggc 


egg tgc 


cgt 


tgg 


ccg 


cqq 


cqq 


caa 


teg 


atg 


AMB pro 


gin 


gly 


pro 


ala 


ala 


arg 


a re 


ql v 


arg cys 


arg 


t ro 


pro 


arg 


a rg 


gin 




met 


61/21 


















91/31 
















ttg cag 


cag 


tta 


caa 


cgc 


caa 


atg 




tct 


gag cgc 


ate 


gtc 


qaq 


ttc 


qat 


caa 

t~uy 


etc 


aac 


leu gin 


gin 


leu 


gin 


arg 


gin 


met 


glu 


ser 


glu arg 


ile 


val 


qlu 


phe 


asp 


gin 


leu 


al v 

y J-y 


121/41 


















151/51 
















agg gga 


gac 


gtt 


gcg 


cag 


cga 


egg 


ate 


caa 


cct get 


ggg 


cct 


qcq 


cct 


teg 


aat 


cga 


caa 


arg gly 


asp 


val 


ala 


gin 


arg 


arg 


ile 


gin 


pro ala 


al v 


Dro 


ala 


pro 


ser 


asn 


arg 


arg 


181/61 


















211/71 














cca ggc 


cac 


cgc 


teg 


ctg 


ccg 


gca 


aca 


aca 


cct gga 


atg 


ggg 


acc 


ttt 


tcq 


ata 


ttq 


ctg 


pro gly 


his 


arg 


ser 


leu 


pro 


ala 


thr 


thr 


pro civ 


met 


al v 


thr 


phe 


ser 


val 


leu 


leu 


241/81 


















271/91 
















gta acc 




aca 


acc 


ggc 


acc 


acg 


cct 


egg 


teg aga 


cat 


ate 


acq 


gca 


accr 

y v_y 


tta 
u «_y 


ncc 
y v-l. 


ctg 


val thr 


gly 


thr 


thr 


gly 


thr 


thr 


pro 


arg 


ser arg 


arg 


ile 


ala 


ala 


ala 


leu 


ala 


leu 


301/101 


















331/111 


















teg ttg 


ctg 


aca 


att 


acc 


get 


ggc 


cgc 


cgc 


ata ttt 


gec 


gcg 


ctg 


ccg 


egg 


gec 


gga 


tec 


ser leu 


leu 


thr 


ile 


thr 


ala 


gly 


arg 


arg 


ile phe 


ala 


ala 


leu 


pro 


arg 


ala 


gly 


ser 


361/121 


















391/131 














agg teg 


acc 


tgc 


cag 


ate 


tea 


ccg 


cgc 


age 


ate tac 


gec 


gtt 


cgc 


tgc 


aaa 


ccg 


ccg 


act 


arg ser 


thr 


cys 


gin 


ile 


ser 


pro 


arg 


ser 


ile tyr 


ala 


val 


arg 


cys 


lys 


pro 


pro 


thr 


421/141 


















451/151 












gcg acg 


gca 


ggc 


cca 


etc 


tct 


tgg 


cat 


gcg 


tec aat 


get 


gcg 


acg 


tec 


teg 


gta 


gac 


aag 


ala tnr 


ala 


gly pro 


leu 


ser 


trp 


his 


ala 


ser asn 


ala 


ala 


thr 


ser 


ser 


val 


asp 


lys 


A Q 1 /1 CI 
4 0 1 / ±01 


















511/171 














etc acg 


ctt 


ggc 


ttc 


atg 


ccg 


cag 


tec 


tac 


cca tgt 


agt 


aac 


aga 


tag 










leu thr 


leu 


gly phe 


met 


pro 


gin 


ser 


tyr 


pro cys 


ser 


asn 


arg 


AMB 
























SEQ ID 


N° 34F 






























FIGURE 34F 


















1/1 


















31/11 


















CAG TCT 


GTC 


GGC 


AAG 


GAG 


GGA 


CGC 


ATG 


CCA 


CTC TCC 


GAT 


CAT 


GAG 


CAG 


CGG 


ATG 


CTT 


GAC 


gin ser 


val 


gly 


lys 


glu 


gly 


arq 


met 


pro 


leu ser 


asp 


his 


glu 


gin 


arg 


me t 


leu 


asp 


61/21 


















91/31 














CAG ATC 


GAG 


AGC 


GCT 


CTC 


TAC 


GCC 


GAA 


GAT 


CCC AAG 


TTC 


GCA 


TCG 


AGT 


GTC 


CGT 


GGC 


GGG 


gin ile 


glu 


ser 


ala 


leu 


tyr 


ala 


glu 


asp 


pro lys 


phe 


ala 


ser 


ser 


va 1 


arg 


y ly 


gly 


121/41 


















151/51 












GGC TTC 


CGC 


GCA 


CCG 


ACC 


GCG 


CGG 


CGG 


CGC 


CTG CAG 


GGC 


GCG 


GCG 


TTG 


TTC 


ATC 


ATC 


GGT 


gly phe 


arg 


ala 


pro 


thr 


ala 


arg 


arg 


arg 


leu gin 


gly 


ala 


ala 


leu 


phe 


ile 


ile 


ql v 


181/61 


















211/71 












CTG GGG 


ATG 


TTG 


GTT 


TCC 


GGC 


GTG 


GCG 


TTC 


AAA GAG 


ACC 


ATG 


ATC 


GGA 


AGT 


TTC 


CCG 


ATA 


leu gly 


met 


leu 


val 


ser 


gly 


val 


ala 


phe 


lys glu 


thr 


met 


ile 


gly 


ser 


phe 


pro 


ile 


241/81 


















271/91 














CTC AGC 


GTT 


TTC 


GGT 


TTT 


GTC 


GTG 


ATG 


TTC 


GGT GGT 


GTG 


GTG 


TAT 


GCC 


ATC 


ACC 


GGT 


CCT 


leu ser 


val 


phe 


gly 


phe 


val 


val 


met 


phe 


gly gly 


val 


va 1 


tyr 


ala 


ile 


thr 


gly 


pro 


301/101 


















331/111 














CGG TTG 


TCC 


GGC 


AGG 


ATG 


GAT 


CGT 


GGC 


GGA 


TCG GCT 


GCT 


GGG 


GCT 


TCG 


CGC 


CAG 


CGT 


CGT 


arg leu 


ser 


gly 


arg 


met 


asp 


arg 


gly 


gly 


ser ala 


ala 


gly 


ala 


ser 


arg 


gin 


arg 


a rg 


361/121 


















391/131 
















ACC AAG 


GGG 


GCC 


GGG 


GGC 


TCA 


TTC 


ACC 


AGC 


CGT ATG 


GAA 


GAT 














thr lys 


gly 


ala 


gly 


gly 


ser 


phe 


thr 


ser 


arg met 


glu 


asp 















SEQ ID N° 35A 
FEUILLE DE REWyR^£M|NT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



107/185 



1/1 

GAC AGT CTG TCG 
asp ser leu ser 
61/21 

ACC AGA TCG AGA 
thr arg ser arg 
121/41 

GGG GCT TCC GCG 
gly ala ser ala 
181/61 

GTC TGG GGA TGT 
val trp gly cys 
241/81 

TAC TCA GCG TTT 
tyr ser ala phe 
301/101 

CTC GGT TGT CCG 
leu gly cys pro 
361/121 

GTA CCA AGG GGG 
val pro arg gly 



GCA AGG AGG GAC 
ala arg arg asp 

GCG CTC TCT ACG 
ala leu ser thr 

CAC CGA CCG CGC 
his arg pro arg 

TGG TTT CCG GCG 
trp phe pro ala 

TCG GTT TTG TCG 
ser val leu ser 

GCA GGA TGG ATC 
ala gly trp ile 

CCG GGG GCT CAT 
pro gly ala his 



31/11 
GCA TGC CAC TCT 
ala cys his ser 

91/31 
CCG AAG ATC CCA 
pro lys ile pro 

151/51 
GGC GGC GCC TGC 
gly gly ala cys 

211/71 
TGG CGT TCA AAG 
trp arg ser lys 

271/91 
TGA TGT TCG GTG 
OPA cys ser val 

331/111 
GTG GCG GAT CGG 
val ala asp arg 

391/131 
TCA CCA GCC GTA 
ser pro ala val 



SEQ ID N° 35B 
FIGURE 35B 



CCG ATC ATG AGC 
pro ile met ser 

AGT TCG CAT CGA 
ser ser his arg 

AGG GCG CGG CGT 
arg ala arg arg 

AGA CCA TGA TCG 
arg pro OPA ser 

GTG TGG TGT ATG 
val trp cys met 

CTG CTG GGG CTT 
leu leu gly leu 

TGG AAG ATC 
trp lys ile 



AGC GGA TGC TTG 
ser gly cys leu 

GTG TCC GTG GCG 
val ser val ala 

TGT TCA TCA TCG 
cys ser ser ser 

GAA GTT TCC CGA 
glu val ser arg 

CCA TCA CCG GTC 
pro ser pro val 

CGC GCC AGC GTC 
arg ala ser val 



1/1 

ACA GTC TGT CGG CAA GGA GGG ACG CAT 
thr val cys arg gin gly gly thr his 
61/21 

CCA GAT CGA GAG CGC TCT CTA CGC CGA 
pro asp arg glu arg ser leu arg arg 
121/41 

GGG CTT CCG CGC ACC GAC CGC GCG GCG 
gly leu pro arg thr asp arg ala ala 
181/61 

TCT GGG GAT GTT GGT TTC CGG CGT GGC 
ser gly asp val gly phe arg arg gly 
241/81 

ACT CAG CGT TTT CGG TTT TGT CGT GAT 
thr gin arg phe arg phe cys arg asp 
301/101 

TCG GTT GTC CGG CAG GAT GGA TCG TGG 
ser val val arg gin asp gly ser trp 
361/121 

TAC CAA GGG GGC CGG GGG CTC ATT CAC 
tyr gin gly gly arg gly leu ile his 



31/11 

GCC ACT CTC CGA TCA TGA GCA GCG GAT GCT TGA 
ala thr leu arg ser OPA ala ala aso ala OPA 
91/31 

AGA TCC CAA GTT CGC ATC GAG TGT CCG TGG CGG 
arg ser gin val arg ile glu cys pro trp arg 
151/51 

GCG CCT GCA GGG CGC GGC GTT GTT CAT CAT CGG 
ala pro ala gly arg gly val val his his arg 
211/71 

GTT CAA AGA GAC CAT GAT CGG AAG TTT CCC GAT 
val gin arg asp his asp arg lys phe pro asp 
271/91 

GTT CGG TGG TGT GGT GTA TGC CAT CAC CGG TCC 
val arg trp cys gly val cys his his arg ser 
331/111 

CGG ATC GGC TGC TGG GGC TTC GCG CCA GCG TCG 
arg ile gly cys trp gly phe ala pro ala ser 

391/131 
CAG CCG TAT GGA AGA TC 
gin pro tyr gly arg 



SEQ ID N° 35C 



FEU1LLE DE REIVlR5^fl^ff (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



108/185 



sequence Rv2169c predite par Cole et al . (Nature 393:537-544) et contenant 
partiellement seq35A 



1/1 








atg cca 


etc 


tec 


gat 


Met pro 


leu 


ser 


asp 


61/21 








gaa gat 


ccc 


aag 


ttc 


glu asp 


pro 


lys 


phe 


121/41 








egg cgc 


ctg 


cag 


ggc 


arg arg 


leu 


gin 


gly 


181/61 








gcg ttc 


aaa 


gag 


acc 


ala phe 


lys 


glu 


thr 


241/81 








atg ttc 


ggt 


ggt 


gtg 


met phe 


gly 


gly 


val 


301/101 








ggc gga 


teg 


get 


get 


gly gly 


ser 


ala 


ala 


361/121 








acc age 


cgt 


atg 


gaa 


thr ser 


arg 


met 


glu 



cat gag cag egg atg 
his glu gin arg met 

gca teg agt gtc cgt 
ala ser ser val arg 

gcg gcg ttg ttc ate 
ala ala leu phe ile 

atg ate gga agt ttc 
met ile gly ser phe 

gtg tat gee ate acc 
val tyr ala ile thr 

ggg get teg cgc cag 
gly ala ser arg gin 

gat egg ttc egg cgc 
asp arg phe arg arg 



31/11 








ctt gac 


cag 


ate 


gag 


leu asp 


gin 


ile 


glu 


91/31 








aac aaa 
^ y y y 


aac 


ttc 


cgc 


alv alv 


al v 


phe 


a r g 


151/51 








ate ggt 


ctg 


ggg 


atg 


ile gly 


leu 


gly 


met 


211/71 








ccg ata 


etc 


age 


gtt 


pro ile 


leu 


ser 


val 


271/91 








ggt cct 


egg 


ttg 


tec 


gly pro 


arg 


leu 


ser 


331/111 








cgt cgt 


acc 


aag 


ggg 


arg arg 


thr 


lys 


gly 


391/131 








cgc ttc 


gac 


gag 


taa 


arg phe 


asp 


glu 


OCH 



age get etc tac gee 
ser ala leu tyr ala 

gca ccg acc gcg egg 
ala pro thr ala arg 

ttg gtt tec ggc gtg 
leu val ser gly val 

ttc ggt ttt gtc gtg 
phe gly phe val val 

ggc agg atg gat cgt 
gly arg met asp arg 

gec ggg ggc tea ttc 
ala gly gly ser phe 



SEQ ID N° 35D 
FIGURE 35D 



ORF d'apres Cole et al. (Nature 393:537- 
1/1 

tga cag tct gtc ggc aag gag gga cgc atg 
OPA gin ser val gly lys glu gly arg met 
61/21 

gac cag ate gag age get etc tac gee gaa 
asp gin ile glu ser ala leu tyr ala glu 
121/41 

ggg ggc ttc cgc gca ccg acc gcg egg egg 
gly gly phe arg ala pro thr ala arg arg 
181/61 

ggt ctg ggg atg ttg gtt tec ggc gtg gcg 
gly leu gly met leu val ser gly val ala 
241/81 

ata etc age gtt ttc ggt ttt gtc gtg atg 
ile leu ser val phe gly phe val val met 
301/101 

cct egg ttg tec ggc agg atg gat cgt ggc 
pro arg leu ser gly arg met asp arg gly 
361/121 

cgt acc aag ggg gec ggg ggc tea ttc acc 
arg thr lys gly ala gly gly ser phe thr 
421/141 

ttc gac gag taa 
phe asp glu OCH 

SEQ 



544) et contennant Rv2169c 
31/11 

cca etc tec gat cat gag cag egg atg ctt 
pro leu ser asp his glu gin arg met leu 
91/31 

gat ccc aag ttc gca teg agt gtc cgt ggc 
asp pro lys phe ala ser ser val arg gly 
151/51 

cgc ctg cag ggc gcg gcg ttg ttc ate ate 
arg leu gin gly ala ala leu phe ile ile 
211/71 

ttc aaa gag acc atg ate gga agt ttc ccg 
phe lys glu thr met ile gly ser phe pro 
271/91 

ttc ggt ggt gtg gtg tat gec ate acc ggt 
phe gly gly val val tyr ala ile thr gly 
331/111 

gga teg get get ggg get teg cgc cag cgt 
gly ser ala ala gly ala ser arg gin arg 
391/131 

age cgt atg gaa gat egg ttc egg cgc cgc 
ser arg met glu asp arg phe arg arg arg 



35F 



FEUILLE DE REW^^^NI(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



109/185 



1/1 

GAC CTG GGA CGA AGA CGA CGG 
asp leu gly arg arg arg arg 
61/21 

CAA TGG ACA CCC GAC TAC GGT 
gin trp thr pro asp tyr gly 
121/41 

GTG GTC GGA GTG CCA CCC GAC 
val val gly val pro pro asp 
181/61 

ACG GCG CCG GTC TGG ATC ACC 
thr ala pro val trp ile thr 
241/81 

GGG GCA CCC GGT GGC ACC GTT 
gly ala pro gly gly thr val 
301/101 

GCC AAC GGC GGC CGG CTG GAC 
ala asn gly gly arg leu asp 
361/121 

GTC GAC CCC GAC GGC GCC GTC 
val asp pro asp gly ala val 









31/11 




CAG 


CAG 


CCG 


CAA TCA 


GAT 


gin 


gin 


p ro 


gin s e r 


asp 








91/31 




GCG 


CCT 


GCG 


CGG CTC 


GAC 


ala 


pro 


ala 


arg leu 


asp 








151/51 




CAG 


GCC 


ACC 


GAC TTC 


GGC 


gin 


ala 


thr 


asp phe 


al v 








211/71 




ATG 


CTG 


TGG 


CCG CTG 


GCC 


met 


leu 


trp 


pro leu 


ala 








271/91 




CCC 


GTC 


CGG 


CTG GTC 


GAC 


pro 


val 


arg 


leu val 


asp 








331/111 




ATC 


CTC 


CTG 


TCG GCG 


GCC 


ile 


leu 


leu 


ser ala 


ala 








391/131 




GGC 


CGA 


GCG 


CTG TGC 


CTG 


gly 


arg 


ala 


leu cys 


leu 



SEQ ID N° 36A 
FIGURE 36A 



CTA CCC GGT CCT GGT CAA CGT 
leu pro gly pro gly gin arg 

AAT GCG CGG TTC CTG TTG CCC 
asn ala arg phe leu leu pro 

TCC GCT GTT GCA CCA GAA ACG 
ser ala val ala pro glu thr 

GAC CGG CCC CGG TTG GCC CCC 
asp arg pro arg leu ala pro 

GAC GAC CTG GCA AAC TCG CTG 
asp asp leu ala asn ser leu 

GAG TTC GCC ACC AAC CGG GAA 
glu phe ala thr asn arg glu 

GCC ATC GAC CCA GAT C 
ala ile asp pro asp 



1/1 

ACC TGG GAC GAA GAC GAC GGC AGC AGC 
thr trp asp glu asp asp gly ser ser 
61/21 

AAT GGA CAC CCG ACT ACG GTG CGC CTG 
asn gly his pro thr thr val arg leu 
121/41 

TGG TCG GAG TGC CAC CCG ACC AGG CCA 
trp ser glu cys his pro thr arg pro 
181/61 

CGG CGC CGG TCT GGA TCA CCA TGC TGT 
arg arg arg ser gly ser pro cys cys 
241/81 

GGG CAC CCG GTG GCA CCG TTC CCG TCC 
gly his pro val ala pro phe pro ser 
301/101 

CCA ACG GCG GCC GGC TGG ACA TCC TCC 
pro thr ala ala gly trp thr ser ser 
361/121 

TCG ACC CCG ACG GCG CCG TCG GCC GAG 
ser thr pro thr ala pro ser ala glu 



31/11 

CGC AAT CAG ATC TAC CCG GTC CTG GTC AAC GTC 
arg asn gin ile tyr pro val leu val asn val 
91/31 

CGC GGC TCG ACA ATG CGC GGT TCC TGT TGC CCG 
arg gly ser thr met arg gly ser cys cys pro 
151/51 

CCG ACT TCG GCT CCG CTG TTG CAC CAG AAA CGA 
pro thr ser ala pro leu leu his gin lys arg 
211/71 

GGC CGC TGG CCG ACC GGC CCC GGT TGG CCC CCG 
gly arg trp pro thr gly pro gly trp pro pro 
271/91 

GGC TGG TCG ACG ACG ACC TGG CAA ACT CGC TGG 
gly trp ser thr thr thr trp gin thr arg trp 
331/111 

TGT CGG CGG CCG AGT TCG CCA CCA ACC GGG AAG 
cys arg arg pro ser ser pro pro thr gly lys 
391/131 

CGC TGT GCC TGG CCA TCG ACC CAG ATC 
arg cys ala trp pro ser thr gin ile 



SEQ ID N° 36B 



FEUILLE DE REM^t®6^VI^P(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



110/185 



1/1 






CCT GGG 


ACG 


AAG 


pro gly 


thr 


lys 


61/21 






ATG GAC 


ACC 


CGA 


met asp 


thr 


arg 


121/41 






GGT CGG 


AGT 


GCC 


gly arg 


ser 


ala 


181/61 






GGC GCC 


GGT 


CTG 


gly ala 


gly 


leu 


241/81 






GGC ACC 


CGG 


TGG 


gly thr 


arg 


trp 


301/101 






CAA CGG 


CGG 


CCG 


gin arg 


arg 


pro 


361/121 






CGA CCC 


CGA 


CGG 


arg pro 


arg 


arg 



ACG ACG GCA GCA 
thr thr ala ala 

CTA CGG TGC GCC 
leu arg cys ala 

ACC CGA CCA GGC 
thr arg pro gly 

GAT CAC CAT GCT 
asp his his ala 

CAC CGT TCC CGT 
his arg ser arg 

GCT GGA CAT CCT 
ala gly his pro 

CGC CGT CGG CCG 
arg arg arg pro 



31/11 
GCC GCA ATC AGA 
ala ala ile arg 

91/31 
TGC GCG GCT CGA 
cys ala ala arg 

151/51 
CAC CGA CTT CGG 
his arg leu arg 

211/71 
GTG GCC GCT GGC 
val ala ala gly 

271/91 
CCG GCT GGT CGA 
pro ala gly arg 

331/111 
CCT GTC GGC GGC 
pro val gly gly 

391/131 
AGC GCT GTG CCT 
ser ala val pro 



SEQ ID N° 36 
FIGURE 36C 



TCT ACC CGG TCC 
ser thr arg ser 

CAA TGC GCG GTT 
gin cys ala val 

CTC CGC TGT TGC 
leu arg cys cys 

CGA CCG GCC CCG 
arg pro ala pro 

CGA CGA CCT GGC 
arg arg pro gly 

CGA GTT CGC CAC 
arg val arg his 

GGC CAT CGA CCC 
gly his arg pro 



TGG TCA ACG TCA 
trp ser thr ser 

CCT GTT GCC CGT 
pro val ala arg 

ACC AGA AAC GAC 
thr arg asn asp 

GTT GGC CCC CGG 
val gly pro arg 

AAA CTC GCT GGC 
lys leu ala gly 

CAA CCG GGA AGT 
gin pro gly ser 

AGA TC 
arg 



Sequence codante Rv3909 predite par Cole et al., 1998 (Nature 393 537-544) 
contenant Seq 36A 

1/1 31/11 

GTG ACC GCA CTG CAA CTC GGC TGG GCC GCT TTG GCG CGC GTC ACC TCA GCG ATC GGC GTC 

met thr ala leu gin leu gly trp ala ala leu ala arg val thr ser ala ile gly va > 
61/21 91/31 

GTG GCC GGC CTC GGG ATG GCG CTC ACG GTA CCG TCG GCG GCA CCG CAC GCG CTC GCA GGC 

val ala gly leu gly met ala leu thr val pro ser ala ala oro his ala leu ala gly 
121/41 151/51 

GAG CCC AGC CCG ACG CCT TTT GTC CAG GTC CGC ATC GAT CAG GTG ACC CCG GAC GTG GTG 

glu pro ser pro thr pro phe val gin val arg ile asp gin val thr pro aso val val 
181/61 211/71 

ACC ACT TCC AGC GAA CCC CAT GTC ACC GTC AGC GGA ACG GTG ACC AAT ACC GGT GAC CGC 

thr thr ser ser glu pro his val thr vai ser gly thr val thr asn thr gly asp a-g 
241/81 271/9f 

CCA GTC CGC GAT GTG ATG GTC CGG CTT GAG CAC GCC GCC GCG GTC ACG TCG TCA ACG GCG 

pro val arg asp val met val arg leu glu his ala ala ala val thr ser ser th- ala 
301/101 331/111 

TTA CGC ACC TCG CTC GAC GGC GGC ACC GAC I AG TAG CA;; CC3 GCC GCG GAC TTC CTC ACG 

leu arg thr ser leu asp gly gly thr asp jln tyr gl-. pro ala ala asp phe leu thr 

SEQ ID N° 36D 

FIGURE 36D 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



111/185 



361/121 








GTC GCC 


CCC 


GAA 


CTA 


val ala 


pro 


glu 


leu 


421/141 








TCG CTG 


ACC 


AGG 


CCG 


ser leu 


thr 


arg 


pro 


481/161 








GTC AAT 


GGG 


ACA 


CCC 


val asn 


gly 


thr 


pro 


541/181 








CCC GTG 


GTC 


GGA 


GTG 


pro val 


val 


gly 


val 


601/201 








ACG ACG 


GCG 


CCG 


GTC 


thr thr 


ala 


pro 


val 


661/221 








CCC GGG 


GCA 


CCC 


GGT 


pro gly 


ala 


pro 


gly 


721/241 








CTG GCC 


AAC 


GGC 


GGC 


leu ala 


asn 


gly 


gly 


781/261 








GAA GTC 


GAC 


CCC 


GAC 


glu val 


asp 


pro 


asp 


841/281 








CTC ATC 


ACC 


GTC 


AAT 


leu ile 


thr 


val 


asn 


901/301 








GCT CAA 


CTA 


CCG 


GGC 


ala gin 


leu 


pro 


gly 


961/321 








CTG GAT 


CGA 


TTG 


CGG 


leu asp 


arg 


leu 


arg 


1021/341 






GCC GAC 


CTG 


GAT 


GCT 


ala asp 


leu 


asp 


ala 


1081/361 






AGC CCC 


GCC 


GAC 


ATC 


ser pro 


ala 


asp 


ile 


1141/381 






CTG CCC 


GAC 


GGC 


CCG 


leu pro 


asp 


gly 


pro 


1201/401 






GTT GCC 


GTC 


GCG 


GCC 


val ala 


val 


ala 


ala 


1261/421 






TCC GCG 


CTC 


TTA 


CCC 


ser ala 


leu 


leu 


pro 


1321/441 






TTT GAT 


CCC 


GCG 


GTC 


phe asp 


pro 


ala 


val 


1381/461 






TAT CTA 


GAT 


CCC 


TCG 


tyr leu 


asp 


pro 


ser 



GAC CGC GGG CAA GAG 
asp arg gly gin glu 

TCG TTG GCC GTC AAC 
ser leu ala val asn 

GAC TAC GGT GCG CCT 
asp tyr gly ala pro 

CCA CCC GAC CAG GCC 
pro pro asp gin ala 

TGG ATC ACC ATG CTG 
trp ile thr met leu 

GGC ACC GTT CCC GTC 
gly thr val pro val 

CGG CTG GAC ATC CTC 
arg leu asp ile leu 

GGC GCC GTC GGC CGA 
gly ala val gly arg 

GCG ATG ACC GGC GGC 
ala met thr gly gly 

ACC CCG ACC CAC CCG 
thr pro thr his pro 

ACG CTA GTC CAC CGG 
thr leu val his arg 

TTG CAG CGG GTT AAT 
leu gin arg val asn 

GTC GAC CGC ATC CTG 
val asp arg ile leu 

TTG ACC GGC CGG GCG 
leu thr gly arg ala 

GCC GAT TTT AGC CCC 
ala asp phe ser pro 

GCT ACC GCG CCC CGG 
ala thr ala pro arg 

GGG GCC GCG CTG GCC 
gly ala ala leu ala 

TTG TTC GTT CGG ATC 
leu phe val arg ile 



391/131 

GCC GGC TTT ACC CTC 
ala gly phe thr leu 
451/151 

CAG CCC GGG ATC TAC 
gin pro gly ile tyr 
511/171 

GCG CGG CTC GAC AAT 
ala arg leu asp asn 
571/191 

ACC GAC TTC GGC TCC 
thr asp phe gly ser 
631/211 

TGG CCG CTG GCC GAC 
trp pro leu ala asp 
691/231 

CGG CTG GTC GAC GAC 
arg leu val asp asp 
751/251 

CTG TCG GCG GCC GAG 
leu ser ala ala glu 
811/271 

GCG CTG TGC CTG GCC 
ala leu cys leu ala 
871/291 

TAC GTC GTG TCC GAC 
tyr val val ser asp 
931/311 

GGC ACC GGC CAG GCC 
gly thr gly gin ala 
991/331 

ACA TGC GTG ACG CCG 
thr cys val thr pro 
1051/351 

GAT CCG AGG CTG AGC 
asp pro arg leu ser 
1111/371 

GAT GTC AGC TCC ACC 
asp val ser ser thr 
1171/391 

ATC AAC TTG CTC AGC 
ile asn leu leu ser 
1231/411 

GAG GAA CAG CAG GGT 
glu glu gin gin gly 
1291/431 

CGG TTG TCC CCG CGG 
arg leu ser pro arg 
1351/451 

GCC GCG GGA ACA AAC 
ala ala gly thr asn 
1411/471 

GCG CAT GAA TCG ATC 
ala his glu ser ile 



TCG GCC CCG CTG CGC 
ser ala pro leu arg 

CCG GTC CTG GTC AAC 
pro val leu val asn 

GCG CGG TTC CTG TTG 
ala arg phe leu leu 

GCT GTT GCA CCA GAA 
ala val ala pro glu 

CGG CCC CGG TTG GCC 
arg pro arg leu ala 

GAC CTG GCA AAC TCG 
asp leu ala asn ser 

TTC GCC ACC AAC CGG 
phe ala thr asn arg 

ATC GAC CCA GAT CTA 
ile asp pro asp leu 

TCG CCC GAC GGG GCC 
ser pro asp gly ala 

GCC GCA TCC AGC TGG 
ala ala ser ser trp 

CTG CCT TTT GCC CAA 
leu pro phe ala gin 

GCG ATC GCA ACC ATC 
ala ile ala thr ile 

CGC GGC GCA ACC GTG 
ar 9 gly ala thr val 

ACC CAC GGC AAC ACG 
thr his gly asn thr 

TCG TCC CAG ATC GGC 
ser ser gin ile gly 

GTG GTA GCG GCG CCG 
val val ala ala pro 

CCG ACC GTT CCT ACC 
pro thr val pro thr 

ACC GCG CGC CGC CAG 
thr ala arg arg gin 



SEQ ID N° 36D (suite 1) 
FEUILLE D^F?eB¥ > LA@fe[VfeW (RE<Sfi.E 26) 



WO 99/09186 



PCT/FR98/01813 



112/185 



1441/481 

GAC GCC TTG GGC GCA ATG CTG TGG CGC AGC 
asp ala leu gly ala met leu trp arg ser 
1501/501 

ATC CTG GTG CCG CCG GCG TCG TGG AGC CTG 
ile leu val pro pro ala ser trp ser leu 
1561/521 

GCG CTG GCC ACC GCC ATC CGG TCT GGC CTG 
ala leu ala thr ala ile arg ser gly leu 
1621/541 

GCT GAC GCC GCG GCC CGC ACC GAG CCA CCG 
ala asp ala ala ala arg thr glu pro pro 
1681/561 

GGC CGG TTC AAT GAC GAC ATC ACC ACG CAG 
gly arg phe asn asp asp ile thr thr gin 
1741/581 

CTG ACC TCG GCG TTG ACC ATC GAT GAC CGC 
leu thr ser ala leu thr ile asp asp arg 
1801/601 

CCA CTA CGC GAG GAC ATG TTG CGC GCG CTG 
pro leu arg glu asp met leu arg ala leu 
1861/621 

GGG CTG GCC CAG CAG CGG CTG GCC GTC GTT 
gly leu ala gin gin arg leu ala val val 
1921/641 

GTG ACC ATC GTC AAC CCG GGC GGC TCC TAC 
val thr ile val asn pro gly gly ser tyr 
1981/661 

TTG GCG CTG CAT AAT GGC CTC GCC GTG CCA 
leu ala leu his asn gly leu ala val pro 
2041/681 

CCC GGG ATG ACG GTG GCC GAT GTC GGT CAG 
pro gly met thr val ala asp val gly gin 
2101/701 

CGA GTA CCA ATC GAG GTG AAC TTC ACA CAG 
arg val pro ile glu val asn phe thr gin 
2161/721 

CCC GAC GGC GTC GCG CTG GGT GAA CCG GTG 
pro asp gly val ala leu gly glu pro val 
2221/741 

AAG GTG TTG TTC GCG ATC ACG CTA TCC GCT 
lys val leu phe ala ile thr leu ser ala 
2281/761 

CGC CTT TGG CAC CGG TTC CGT GGC CAG CCT 
arg leu trp his arg phe arg gly gin pro 
2341/781 

CCT ACC GGC AAA CAC GCC CCG CAG CGC CGT 
pro thr gly lys his ala pro gin arg arg 
2401/801 
CGG GTA TGA 
arg val OPA 



1471/491 
















TTG GAG CCG 


AAT 


GCC 


GCG 


CCC 


CGT 


ACC 


CAA 


leu glu pro 


asn 


al a 


ala 


pro 


a rg 


thr 


gin 


1531/511 














GCC AGC GAC 


GAC 


GCG 


CAG 


GTC 


ATC 


CTG 


ACC 


ala ser asp 


asp 


ala 


din 


val 


ile 


leu 


thr 


1591/531 
















GCC GTG CCG 


CGA 


CCA 


CTA 


CCG 


GCG 


GTG 


ATC 


ala val pro 


arg 


pro 


leu 


nro 


ala 


val 


ile 


1651/551 
















GAA CCC CCG 


GGC 


GCT 


TAC 


AGC 


GCC 


GCT 


CGC 


glu pro pro 


gly 


ala 


t vr 


ser 


ala 


ala 


arg 


1711/571 














ATC GGC GGG 


CAG 


GTT 


GCC 


CGG 


CTA 


TGG 


AAG 


ile gly gly 


gin 


val 


ala 


ara 


leu 


tro 


lys 


1771/591 
















ACC GGG CTG 


ACC 


GGC 


GTG 


CAG 


TAC 


ACC 


GCA 


thr gly leu 


thr 


gly 


val 


oln 


tvr 


thr 


ala 


1831/611 
















AGC CAA TCG 


CTA 


CCA 


CCC 


GAT 


ACC 


CGC 


AAC 


ser gin ser 


leu 


pro 


pro 


asD 


thr 


arg 


asn 


1891/631 
















GGA AAG ACG 


ATC 


GAC 


GAT 


CTT 


TTC 


GGC 


GCG 


gly lys thr 


ile 


asp 


asp 


leu 


phe 


gly 


ala 


1951/651 
















ACT CTG GCC 


ACC 


GAG 


CAC 


AGT 


CCG 


CTG 


CCG 


thr leu ala 


thr 


glu 


his 


ser 


pro 


leu 


pro 


2011/671 














ATC CGG GTC 


CGG 


CTA 


CAG 


GTC 


GAT 


GCT 


CCG 


ile arg val 


ara 


leu 


gin 


val 


a s o 


ala 


pro 


2071/691 














ATC GAG CTA 


CCG 


CCC 


GGG 


TAC 


CTG 


CCG 


CTA 


ile glu leu 


pro 


d r o 


al v 


t vr 


leu 


pro 


leu 


2131/711 
















CGG GTT GCC 


GTC 


GAC 


GTG 


TCG 


CTG 


CGG 


ACC 


arg val ala 


val 


asp 


val 


ser 


leu 


arg 


thr 


2191/731 














CGG TTG TCG 


GTG 


CAC 


TCC 


AAC 


GCC 


TAC 


GGC 


arg leu ser 


val 


his 


ser 


asn 


ala 


tyr 


gly 


2251/751 












GCG GCC GTG 


CTG 


GTA 


ACG 


CTG 


GCG 


GGC 


CGG 


ala ala val 


leu 


val 


thr 


leu 


ala 


gly 


arg 


2311/771 












GAT CGC GCC 


GAC 


CTG 


GAT 


CGC 


CCC 


GAC 


CTG 


asp arg ala 


asp 


leu 


asp 


arg 


pro 


asp 


leu 


2371/791 
















GCC GTA GCC 


AGT 


CGG 


GAT 


GAC 


GAA 


AAG 


CAC 


ala val ala 


ser 


arg 


asp 


asp 


glu 


lys 


his 



SEQ ID N° 36D (suite 2) 

FIGURE 36D (suite 2) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



113/185 



ORF d'apres Cole et al . , 1998 (Nature 3! 
1/1 

TGA CTC AGC ACC GGG TCA GCA CAA CGG TCC 
OPA leu ser thr gly ser ala gin arg ser 
61/21 

GGC TGG GCC GCT TTG GCG CGC GTC ACC TCA 
gly trp ala ala leu ala arg val thr ser 
121/41 

GCG CTC ACG GTA CCG TCG GCG GCA CCG CAC 
ala leu thr val pro ser ala ala pro his 
181/61 

TTT GTC CAG GTC CGC ATC GAT CAG GTG ACC 
phe val gin val arg ile asp gin val thr 
241/81 

CAT GTC ACC GTC AGC GGA ACG GTG ACC AAT 
his val thr val ser gly thr val thr asn 
301/101 

GTC CGG CTT GAG CAC GCC GCC GCG GTC ACG 
val arg leu glu his ala ala ala val thr 
361/121 

GGC GGC ACC GAC CAG TAC CAG CCG GCC GCG 
gly gly thr asp gin tyr gin pro ala ala 
421/141 

CGC GGG CAA GAG GCC GGC TTT ACC CTC TCG 
arg gly gin glu ala gly phe thr leu ser 
481/161 

TTG GCC GTC AAC CAG CCC GGG ATC TAC CCG 
leu ala val asn gin pro gly ile tyr pro 
541/181 

TAC GGT GCG CCT GCG CGG CTC GAC AAT GCG 
tyr gly ala pro ala arg leu asp asn ala 
601/201 

CCC GAC CAG GCC ACC GAC TTC GGC TCC GCT 
pro asp gin ala thr asp phe gly ser ala 
661/221 

ATC ACC ATG CTG TGG CCG CTG GCC GAC CGG 
ile thr met leu trp pro leu ala asp arg 
721/241 

ACC GTT CCC GTC CGG CTG GTC GAC GAC GAC 
thr val pro val arg leu val asp asp asp 
781/261 

CTG GAC ATC CTC CTG TCG GCG GCC GAG TTC 
leu asp ile leu leu ser ala ala glu phe 
841/281 

GCC GTC GGC CGA GCG CTG TGC CTG GCC ATC 
ala val gly arg ala leu cys leu ala ile 
901/301 

ATG ACC GGC GGC TAC GTC GTG TCC GAC TCG 
met thr gly gly tyr val val ser aso ser 
961/321 

CCG ACC CAC CCG GGC ACC GGC CAG GCC GCC 
pro thr his pro gly thr gly gin ala ala 



>3 537-544) et contenant Rv 3909. 
31/11 

CGG GCC GGG GCC GTG ACC GCA CTG CAA CTC 
arg ala gly ala val thr ala leu gin leu 
91/31 

GCG ATC GGC GTC GTG GCC GGC CTC GGG ATG 
ala ile gly val val ala gly leu gly met 
151/51 

GCG CTC GCA GGC GAG CCC AGC CCG ACG CCT 
ala leu ala gly glu pro ser pro thr pro 
211/71 

CCG GAC GTG GTG ACC ACT TCC AGC GAA CCC 
pro asp val val thr thr ser ser glu pro 
271/91 

ACC GGT GAC CGC CCA GTC CGC GAT GTG ATG 
thr gly asp arg pro val arg aso val met 
331/111 

TCG TCA ACG GCG TTA CGC ACC TCG CTC GAC 
ser ser thr ala leu arg thr ser leu asp 
391/131 

GAC TTC CTC ACG GTC GCC CCC GAA CTA GAC 
asp phe leu thr val ala pro glu leu asp 
451/151 

GCC CCG CTG CGC TCG CTG ACC AGG CCG TCG 
ala pro leu arg ser leu thr arg pro ser 

511/171 

GTC CTG GTC AAC GTC AAT GGG ACA CCC GAC 
val leu val asn val asn gly thr pro asp 
571/191 

CGG TTC CTG TTG CCC GTG GTC GGA GTG CCA 
arg phe leu leu oro val val gly val pro 

631/211 

GTT GCA CCA GAA ACG ACG GCG CCG GTC TGG 
val ala pro glu thr thr ala pro val tro 
691/231 

CCC CGG TTG GCC CCC GGG GCA CCC GGT GGC 
pro arg leu ala pro glv ala pro gly gly 
751/251 

CTG GCA AAC TCG CTG GCC AAC GGC GGC CGG 
leu ala asn ser leu ala asn gly gly arg 
811/271 

GCC ACC AAC CGG GAA GTC GAC CCC GAC GGC 
ala thr asn arg glu val asp pro asp gly 
871/291 

GAC CCA GAT CTA CTC ATC ACC GTC AAT GCG 
asp pro asp leu leu ile thr val asn ala 
931/311 

CCC GAC GGG GCC GCT CAA CTA CCG GGC ACC 
pro asp gly ala ala gin leu pro gly thr 
991/331 

GCA TCC AGC TGG CTG GAT CGA TTG CGG ACG 
ala ser ser trp leu asp arg leu arg thr 



SEQ ID N° 36F 
FEUILLE DE REMPL«G^IB€F(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



114/185 



1021/341 

CTA GTC CAC CGG ACA 
leu val his arg thr 
1081/361 

CAG CGG GTT AAT GAT 
gin arg val asn asp 
1141/381 

GAC CGC ATC CTG GAT 
asp arg ile leu asp 
1201/401 

ACC GGC CGG GCG ATC 
thr gly arg ala ile 
1261/421 

GAT TTT AGC CCC GAG 
asp phe ser pro glu 
1321/441 

ACC GCG CCC CGG CGG 
thr ala pro arg arg 
1381/461 

GCC GCG CTG GCC GCC 
ala ala leu ala ala 
1441/481 

TTC GTT CGG ATC GCG 
phe val arg ile ala 
1501/501 

CTG TGG CGC AGC TTG 
leu trp arg ser leu 
1561/521 

TCG TGG AGC CTG GCC 
ser trp ser leu ala 
1621/541 

CGG TCT GGC CTG GCC 
arg ser gly leu ala 
1681/561 

ACC GAG CCA CCG GAA 
thr glu pro pro glu 
1741/581 

ATC ACC ACG CAG ATC 
ile thr thr gin ile 
1801/601 

ATC GAT GAC CGC ACC 
ile asp asp arg thr 
1861/621 

TTG CGC GCG CTG AGC 
leu arg ala leu ser 
1921/641 

CTG GCC GTC GTT GGA 
leu ala val val gly 
1981/651 

GGC GGC TCC TAC ACT 
gly gly ser tyr thr 



TGC GTG ACG CCG CTG 
cys val thr pro leu 

CCG AGG CTG AGC GCG 
pro arg leu ser ala 

GTC AGC TCC ACC CGC 
val ser ser thr arg 

AAC TTG CTC AGC ACC 
asn leu leu ser thr 

GAA CAG CAG GGT TCG 
glu gin gin gly ser 

TTG TCC CCG CGG GTG 
leu ser pro arg val 

GCG GGA ACA AAC CCG 
ala gly thr asn pro 

CAT GAA TCG ATC ACC 
his glu ser ile thr 

GAG CCG AAT GCC GCG 
glu pro asn ala ala 

AGC GAC GAC GCG CAG 
ser asp asp ala gin 

GTG CCG CGA CCA CTA 
val pro arg pro leu 

CCC CCG GGC GCT TAC 
pro pro gly ala tyr 

GGC GGG CAG GTT GCC 
gly gly gin val ala 

GGG CTG ACC GGC GTG 
gly leu thr gly val 

CAA TCG CTA CCA CCC 
gin ser leu pro pro 

AAG ACG ATC GAC GAT 
lys thr ile asp asp 

CTG GCC ACC GAG CAC 
leu ala thr glu his 



1051/351 

CCT TTT GCC CAA GCC 
pro phe ala gin ala 
1111/371 

ATC GCA ACC ATC AGC 
ile ala thr ile ser 
1171/391 

GGC GCA ACC GTG CTG 
gly ala thr val leu 
1231/411 

CAC GGC AAC ACG GTT 
his gly asn thr val 
1291/431 

TCC CAG ATC GGC TCC 
ser gin lie gly ser 
1351/451 

GTA GCG GCG CCG TTT 
val ala ala pro phe 
1411/471 

ACC GTT CCT ACC TAT 
thr val pro thr tyr 
1471/491 

GCG CGC CGC CAG GAC 
ala arg arg gin asp 
1531/511 

CCC CGT ACC CAA ATC 
pro arg thr gin ile 
1591/531 

GTC ATC CTG ACC GCG 
val ile leu thr ala 
1651/551 

CCG GCG GTG ATC GCT 
pro ala val ile ala 
1711/571 

AGC GCC GCT CGC GGC 
ser ala ala arg gly 
1771/591 

CGG CTA TGG AAG CTG 
arg leu trp lys leu 
1631/611 

CAG TAC ACC GCA CCA 
gin tyr thr ala pro 
1891/631 

GAT ACC CGC AAC GGG 
asp thr arg asn glv 
1951/651 

CTT TTC GGC GCG GTG 
leu phe gly ala val 
2011/671 

AGT CCG CTG CCG TTG 
ser pro leu pro leu 



GAC CTG GAT GCT TTG 
asp leu asp ala leu 

CCC GCC GAC ATC GTC 
pro ala asp ile val 

CCC GAC GGC CCG TTG 
pro asp gly pro leu 

GCC GTC GCG GCC GCC 
ala val ala ala ala 

GCG CTC TTA CCC GCT 
ala leu leu pro ala 

GAT CCC GCG GTC GGG 
asp pro ala val gly 

CTA GAT CCC TCG TTG 
leu asp pro ser leu 

GCC TTG GGC GCA ATG 
ala leu gly ala met 

CTG GTG CCG CCG GCG 
leu val pro pro ala 

CTG GCC ACC GCC ATC 
leu ala thr ala ile 

GAC GCC GCG GCC CGC 
asp ala ala ala arg 

CGG TTC AAT GAC GAC 
arg phe asn asp asp 

ACC TCG GCG TTG ACC 
thr ser ala leu thr 

CTA CGC GAG GAC ATG 
leu arg glu asp met 

CTG GCC CAG CAG CGG 
leu ala gin gin arg 

ACC ATC GTC AAC CCG 
thr ile val asn pro 

GCG CTG CAT AAT GGC 
ala leu his asn gly 



SEQ ID 36F (suite 1) 
FIGURE 36F (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



115/185 



2041/681 

CTC GCC GTG CCA ATC 
leu ala val pro ile 
2101/701 

GAT GTC GGT CAG ATC 
asp val gly gin ile 
2161/721 

AAC TTC ACA CAG CGG 
asn phe thr gin arg 
2221/741 

GGT GAA CCG GTG CGG 
gly glu pro val arg 
2281/761 

ACG CTA TCC GCT GCG 
thr leu ser ala ala 
2341/781 

CGT GGC CAG CCT GAT 
arg gly gin pro asp 
2401/801 

CCG CAG CGC CGT GCC 
pro gin arg arg ala 



CGG GTC CGG CTA CAG 
arg val arg leu gin 

GAG CTA CCG CCC GGG 
glu leu pro pro gly 

GTT GCC GTC GAC GTG 
val ala val asp val 

TTG TCG GTG CAC TCC 
leu ser val his ser 

GCC GTG CTG GTA ACG 
ala val leu val thr 

CGC GCC GAC CTG GAT 
arg ala asp leu asp 

GTA GCC AGT CGG GAT 
val ala ser arg asp 



2071/691 

GTC GAT GCT CCG CCC 
val asp ala pro pro 
2131/711 

TAC CTG CCG CTA CGA 
tyr leu pro leu arg 
2191/731 

TCG CTG CGG ACC CCC 
ser leu arg thr pro 
2251/751 

AAC GCC TAC GGC AAG 
asn ala tyr gly lys 
2311/771 

CTG GCG GGC CGG CGC 
leu ala gly arg arg 
2371/791 

CGC CCC GAC CTG CCT 
arg pro asp leu pro 
2431/811 

GAC GAA AAG CAC CGG 
asp glu lys his arg 



GGG ATG ACG GTG GCC 
gly met thr val ala 

GTA CCA ATC GAG GTG 
val pro ile glu val 

GAC GGC GTC GCG CTG 
asp gly val ala leu 

GTG TTG TTC GCG ATC 
val leu phe ala ile 

CTT TGG CAC CGG TTC 
leu trp his arg phe 

ACC GGC AAA CAC GCC 
thr gly lys his ala 

GTA TGA 
val OPA 



SEQ ID 36F (suite 2) 



FIGURE 36F (suite 2) 



1/1 

ATC CGC GCG TTG GCG 
ile arg ala leu ala 
61/21 

CAC AGC GGC GCC CAA 
his ser gly ala gin 
121/41 

CTC AAC CTG CCC TGG 
leu asn leu pro trp 
181/61 

GCA GCC GGG CAG CTT 

ala ala gly gin leu 

241/81 

CGC AAG ATC 

arg lys ile 



TCG CAT CCG AAC ATC 
ser his pro asn ile 

ATC ATG GCC GAC ACC 
ile met ala asp thr 

CTG GCC ATG GGC GCC 
leu ala met gly ala 

CGA GAG TTG TTG TCC 
arg glu leu leu ser 



31/11 








GTC GGA 


GTC 


AAG 


GAC 


val gly 


val 


lys 


asp 


91/31 








GGA CTG 


GCC 


TAC 


TAT 


gly leu 


ala 


tyr 


tyr 


151/51 








ACG GGC 


TTC 


ATC 


AGC 


thr gly 


phe 


ile 


ser 


211/71 








GCC TTC 


GGT 


TCT 


GGG 


ala phe 


gly 


ser 


gly 



GCC AAA GCC GAC CTG 
ala lys ala asp leu 

TCC GGC GAC GAC GCG 
ser gly asp asp ala 

GTG ATT GCC CAC CTG 
val ile ala his leu 

GAT ATC GCC ACC GCC 
asp ile ala thr ala 



SEQ ID N° 37A 
FIGURE 37A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



116/185 



1/1 

GAT CCG CGC GTT GGC GTC GCA 
asp pro arg val gly val ala 
61/21 

GCA CAG CGG CGC CCA AAT CAT 
ala gin arg arg pro asn his 
121/41 

GCT CAA CCT GCC CTG GCT GGC 
ala gin pro ala leu ala gly 
181/61 

GGC AGC CGG GCA GCT TCG AGA 
gly ser arg ala ala ser arg 
241/81 

CCG CAA GAT C 
pro gin asp 









31/11 




TCC 


GAA 


CAT 


CGT CGG 


AGT 


ser 


glu 


his 


arg arg 


ser 








91/31 




GGC 


CGA 


CAC 


CGG ACT 


GGC 


gly 


arg 


his 


arg thr 


gly 








151/51 




CAT 


GGG 


CGC 


CAC GGG 


CTT 


his 


gly 


arg 


his gly 


leu 








211/71 




GTT 


GTT 


GTC 


CGC CTT 


CGG 


val 


val 


val 


arg leu 


arg 



SEQ ID N° 37B 
FIGURE 37B 



CAA 


GGA 


CGC 


CAA 


AGC 


CGA 


CCT 


gin 


gly 


arg 


gin 


ser 


arg 


pro 


CTA 


CTA 


TTC 


CGG 


CGA 


CGA 


CGC 


leu 


leu 


phe 


arg 


arg 


arg 


arg 


CAT 


CAG 


CGT 


GAT 


TGC 


CCA 


CCT 


his 


gin 


a rg 


asp 


cys 


pro 


pro 


TTC 


TGG 


GGA 


TAT 


CGC 


CAC 


CGC 


phe 


trp 


gly 


tyr 


arg 


his 


arg 



1/1 


















31/11 


















TCC GCG 


CGT 


TGG 


CGT 


CGC 


ATC 


CGA 


ACA 


TCG 


TCG GAG 


TCA 


AGG 


ACG 


CCA 


AAG 


CCG 


ACC 


TGC 


ser ala 
61/21 


arg 


trp 


arg 


arg 


ile 


arg 


thr 


ser 


ser glu 
91/31 


ser 


arg 


thr 


pro 


lys 


pro 


thr 


cys 


ACA GCG 


GCG 


CCC 


AAA 


TCA 


TGG 


CCG 


ACA 


CCG 


GAC TGG 


CCT 


ACT 


ATT 


CCG 


GCG 


ACG 


ACG 


CGC 


thr ala 
121/41 


ala 


pro 


lys 


ser 


trp 


pro 


thr 


pro 


asp trp 
151/51 


pro 


thr 


ile 


pro 


ala 


thr 


thr 


arg 


TCA ACC 


TGC 


CCT 


GGC 


TGG 


CCA 


TGG 


GCG 


CCA 


CGG GCT 


TCA 


TCA 


GCG 


TGA 


TTG 


CCC 


ACC 


TGG 


ser thr 
181/51 


cys 


pro 


gly 


trp 


pro 


trp 


ala 


pro 


arg ala 
211/71 


ser 


ser 


ala 


OPA 


leu 


pro 


thr 


trp 


CAG CCG 


GGC 


AGC 


TTC 


GAG 


AGT 


TGT 


TGT 


CCG 


CCT TCG 


GTT 


CTG 


GGG 


ATA 


TCG 


CCA 


CCG 


CCC 


gin pro 


gly 


ser 


phe 


glu 


ser 


cys 


cys 


pro 


pro ser 


val 


leu 


gly 


ile 


ser 


pro 


pro 


pre 



241/81 
GCA AGA TC 
ala arg 



SEQ ID N° 37C 
FIGURE 37C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PO7FR98/01813 



117/185 



Sequence codante Rv2753c predite par 
contenant Seq 37A 

1/1 



GTG ACC 


ACC 


GTC 


GGA 


TTC 


GAC 


GTC 


GCA 


GCG 


val thr 


thr 


val 


gly 


phe 


asp 


val 


ala 


ala 


61/21 


















ACA CCG 


TTT 


AGC 


GGC 


GAT 


GGC 


TCC 


CTG 


GAC 


thr pro 


phe 


ser 


gly 


asp 


gly 


ser 


leu 


asp 


121/41 


















CTG GTC 


GAT 


CAG 


GGG 


TGC 


GAC 


GGT 


CTG 


GTG 


leu val 


asp 


gin 


gly 


cys 


asp 


gly 


leu 


val 


181/61 


















ACC ACC 


GAC 


GGG 


GAG 


AAA 


ATC 


GAG 


CTG 


CTG 


thr thr 


asp 


gly 


glu 


lys 


ile 


glu 


leu 


leu 


241/81 


















GCC CGT 


GTT 


ATC 


GCC 


GGT 


GCC 


GGC 


ACC 


TAT 


ala arg 


val 


ile 


ala 


gly 


ala 


gly 


thr 


tyr 


301/101 


















GCT TGT 


GCG 


GCC 


GAG 


GGT 


GCG 


CAC 


GGG 


CTG 


ala cys 


ala 


ala 


glu 


gly 


ala 


his 


gly 


leu 


361/121 


















CCG CAG 


CGG 


GGG 


CTG 


CAA 


GCC 


CAT 


TTC 


ACC 


pro gin 


arg 


gly 


leu 


gin 


ala 


his 


phe 


thr 


421/141 


















CTG CTC 


TAT 


GAC 


ATC 


CCG 


GGG 


CGG 


TCG 


GCG 


leu leu 


tyr 


asp 


ile 


pro 


giy 


arg 


ser 


ala 


481/161 


















TTG GCG 


TCG 


CAT 


CCG 


AAC 


ATC 


GTC 


GGA 


GTC 


leu ala 


ser 


his 


pro 


asn 


ile 


val 


gly 


val 


541/181 
















GCC CAA 


ATC 


ATG 


GCC 


GAC 


ACC 


GGA 


CTG 


GCC 


ala gin 


ile 


met 


ala 


asp 


thr 


gly 


leu 


ala 


601/201 
















CCC TGG 


CTG 


GCC 


ATG 


GGC 


GCC 


ACG 


GGC 


TTC 


pro trp 


leu 


ala 


met 


gly 


ala 


thr 


gly 


phe 


661/221 


















CAG CTT 


CGA 


GAG 


TTG 


TTG 


TCC 


GCC 


TTC 


GGT 


gin leu 


arg 


glu 


leu 


leu 


ser 


ala 


phe 


gly 


721/241 


















AAC ATT 


GCG 


GTC 


GCC 


CCG 


CTG 


TGC 


AAC 


GCG 


asn ile 


ala 


val 


ala 


pro 


leu 


cys 


asn 


ala 


781/261 
















AAG GCG 


GGC 


TTG 


CGG 


CTG 


CAG 


GGC 


ATC 


GAC 


lys ala 


gly 


leu 


arg 


leu 


gin 


gly 


ile 


asp 


841/281 


















GCG ACA 


CCG 


GAG 


CAG 


ATC 


GAC 


GCG 


TTG 


GCC 


ala thr 


pro 


glu 


gin 


ile 


asp 


ala 


leu 


ala 



Cole et al., 1998 (Nature 393 537-544) 
31/11 

CGC CTA GGA ACC CTG CTG ACC GCG ATG GTG 
arg leu gly thr leu leu thr ala met val 
91/31 

ACC GCC ACC GCG GCG CGG CTG GCC AAC CAC 
thr ala thr ala ala arg leu ala asn his 
151/51 

GTC TCG GGC ACC ACC GGC GAG TCG CCG ACC 
val ser gly thr thr gly glu ser pro thr 
211/71 

CGG GCC GTC TTG GAA GCG GTG GGG GAC CGG 
arg ala val leu glu ala val gly asp arg 
271/91 

GAC ACC GCG CAC AGC ATC CGG CTG GCC AAG 
asp thr ala his ser ile arg leu ala lys 
331/111 

CTG GTG GTC ACG CCC TAC TAT TCC AAG CCG 
leu val val thr oro tyr tyr ser lys pro 
391/131 

GCC GTC GCC GAC GCG ACC GAG CTG CCG ATG 
ala val ala asD ala thr glu leu pro met 
451/151 

GTG CCG ATC GAG CCC GAC ACG ATC CGC GCG 
val pro ile glu pro asp thr ile arg ala 
511/171 

AAG GAC GCC AAA GCC GAC CTG CAC AGC GGC 
lys asp ala lys ala asp leu his ser gly 
571/191 

TAC TAT TCC GGC GAC GAC GCG CTC AAC CTG 
tyr tyr ser gly asp asp ala leu asn leu 
631/211 

ATC AGC GTG ATT GCC CAC CTG GCA GCC GGG 
ile r,er val lie ala his leu ala ala gly 
691/231 

TCT GGG GAT ATC GCC ACC GCC CGC AAG ATC 
ser gly asp ile ala thr ala arg lys ile 

TU / '% C 1 
/ J ± / i- U 1 

ATG AGC CGC CTG GGT GGG GTG ACG TTG TCC 
met ser arg leu gly gly val thr leu ser 
811/27 1 

GTC GGT GAT CCC CGG CTG CCC CAG GTG GCC 
val gly asp pro arg leu pro gin val ala 
871/291 

GCC GAC ATG CGC GCG GCC TCG GTG CTT CGG 
ala asp met arg ala ala ser vai leu arg 



901/301 

TGA 

OPA 



SEQ ID N° 37D 
FIGURE 37D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



118/185 



ORF d'apres Cole et al . , 1998 (Natuj 
1/1 

TAA GGT GAG CGC CGT GGC CGA GAC CGC 
OCH gly glu arg arg gly arg asp arg 
61/21 

CTT CTT GGC CCC ACC CGA CGT GCC CTG 
leu leu gly pro thr arg arg ala leu 
121/41 

CGA GTT CGC CGG CCG GGC CTG CTA TCA 
arg val arg arg pro gly leu leu ser 
181/61 

CAA CGC CGG CTA CCT CCG GCA CAT CAT 
gin arg arg leu pro pro ala his his 
241/81 

CAG CGT GTC GTT CTA CAT CAC CGG GAT 
gin arg val val leu his his arg asp 
301/101 

CCG GCA TTT CTC CTA CTC GCA GCT CTC 
pro ala phe leu leu leu ala ala leu 
361/121 

CGT CGT GCC GCC CGG CAT GGA GGA CGA 
arg arg ala ala arg his gly gly arg 
421/141 

CGA CGC CGC CCG CGC CAC CTA CAG CGA 
arg arg arg pro arg his leu gin arg 
481/161 

CCA ACC CAA CGC GAT CCT GCG CCG CAA 
pro thr gin arg asp pro ala pro gin 
541/181 

CAA CGC CAC CGA AAC CCG CAT CGT GGT 
gin arg his arg asn pro his arg gly 
601/201 

CGC AAT GCG GGC CAG CGA GCA CGC CGA 
arg asn ala gly gin arg ala arg arg 
661/221 

GCG CCA GCT CGC CGC CGT GGC CCC CGC 
ala pro ala arg arg arg gly pro arg 
721/241 

CGA CGG CAC CGA GGT GGC GAC CAG CCC 
arg arg his arg gly gly asp gin pro 
781/261 

GGA CAA ACA CGC GCG CTC GCG GCC GGG 
gly gin thr arg ala leu ala ala gly 
841/281 

ACC GTC GGA TTC GAC GTC GCA GCG CGC 
thr val gly phe asp val ala ala arg 
901/301 

TTT AGC GGC GAT GGC TCC CTG GAC ACC 
phe ser gly asp gly ser leu asp thr 
961/321 

GAT CAG GGG TGC GAC GGT CTG GTG GTC 
asp gin gly cys asp gly leu val val 



e 393 537-544) contenant Rv2753c 
31/11 

GCC GCT GCG CGT GCA ACT GAT CGC CAA GAC CGA 
ala ala ala arg ala thr asp arg gin asp arg 
91/31 

GAC CAC CGA CGC CGA CGG CGG ACC CGC GCT GGT 
asp his arg arg arg arg arg thr arg ala gly 
151/51 

GAG CTG GTC CAA GCC CAA TCC CAA GAC CGC CAC 
glu leu val gin ala gin ser gin asp arg his 
211/71 

CGA CGT CGG ACA TTT CTC GGT GCT AGA GCA TGC 
arg arg arg thr phe leu gly ala arg ala cys 
271/91 

CTC GCG ATC GTG CAC CCA CGA GCT GAT CCG CCA 
leu ala ile val his pro arg ala asp pro pro 
331/111 

CCA GCG CTA CGT ACC CGA GAA GGA CTC GCG GGT 
pro ala leu arg thr arg glu gly leu ala gly 
391/131 

CGC CGA CCT GCG CCA CAT CCT GAC CGA GGC CGC 
arg arg pro ala pro his oro asp arg gly arg 
451/151 

GCT GCT GGC CAA GCT GGA AGC CAA GTT CGC CGA 
ala ala gly gin ala gly ser gin val arg arg 
511/171 

GCA GGC CCG CCA AGC CGC CCG CGC GGT GCT GCC 
ala gly pro pro ser arg pro arg gly ala ala 
571/191 

GAC CGG CAA CTA CCG GGC CTG GCG GCA CTT CAT 
asp arg gin leu pro gly leu ala ala leu his 
631/211 

CGT GGA AAT CCG GCG ACT GGC CAT CGA ATG CCT 
arg gly asn pro ala thr gly his arg met pro 
691/231 

GGT GTT CGC CGA CTT CGA GGT GAC CAC CCT GGC 
gly vai arg arg leu arg gly asp his pro gly 
751/251 

GTT GGC GAC CGA AGC CTG AGG CGG CGT GTC GCT 
val gly asp arg ser leu arg arg arg val ala 
811/271 

ATA AAG CGC CAG GTA ACC TTG GGA GCC GTG ACC 
ile lys arg gin val thr leu gly ala val thr 
871/291 

CTA GGA ACC CTG CTG ACC GCG ATG GTG ACA CCG 
leu gly thr leu leu thr ala met val thr pro 
931/311 

GCC ACC GCG GCG CGG CTG GCC AAC CAC CTG GTC 
ala thr ala ala arg leu ala asn his leu val 
991/331 

TCG GGC AC: ACC GGC GAG TCG CCG ACC ACC ACC 
ser gly thr thr gly glu ser pro thr thr thr 



SEQ ID N° 37F 



FIGURE 37F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



119/185 



1021/341 
















1051/351 
















GAC GGG GAG 


AAA 


ATC 


GAG 


CTG 


CTG 


CGG 


GCC 


GTC TTG GAA 


GCG 


GTG 


GGG 


GAC 


CGG 


GCC 


CGT 


asp gly glu 


lys 


ile 


glu 


leu 


leu 


arg 


ala 


val leu glu 


ala 


val 


alv 


asp 


arg 


ala 


arg 


1081/361 
















1111/371 










GTT ATC GCC 


GGT 


GCC 


GGC 


ACC 


TAT 


GAC 


ACC 


GCG CAC AGC 


ATC 


CGG 


CTG 


GCC 


AAG 


GCT 


TGT 


val ile ala 


gly 


ala 


gly 


thr 


tyr 


asp 


thr 


ala his ser 


ile 


a to 


leu 


ala 


lvs 


ala 


cys 


1141/381 
















1171/391 












GCG GCC GAG 


GGT 


GCG 


CAC 


GGG 


CTG 


CTG 


GTG 


GTC ACG CCC 


TAC 


TAT 


TCC 


AAG 


CCG 


CCG 


CAG 


ala ala glu 


gly 


ala 


his 


gly 


leu 


leu 


val 


val thr pro 


tyr 


tvr 


ser 


1 vs 
j 


pro 


pro 


gin 


1201/401 
















1231/411 








CGG GGG CTG 


CAA 


GCC 


CAT 


TTC 


ACC 


GCC 


GTC 


GCC GAC GCG 


ACC 


GAG 


CTG 


CCG 


ATG 


CTG 


CTC 


arg gly leu 


gin 


ala 


his 


phe 


thr 


ala 


val 


ala asp ala 


thr 


alu 


leu 


pro 


met 


leu 


leu 


1261/421 
















1291/431 














TAT GAC ATC 


CCG 


GGG 


CGG 


TCG 


GCG 


GTG 


CCG 


ATC GAG CCC 


GAC 


ACG 


ATC 


CGC 


GCG 


TTG 


GCG 


tyr asp ile 


pro 


giy 


arg 


ser 


ala 


val 


pro 


ile glu pro 


asp 


thr 


ile 


arg 


ala 


leu 


ala 


1321/441 
















1351/451 














TCG CAT CCG 


AAC 


ATC 


GTC 


GGA 


GTC 


AAG 


GAC 


GCC AAA GCC 


GAC 


CTG 


CAC 


AGC 


GGC 


GCC 


CAA 


ser his pro 


asn 


ile 


val 


gly 


val 


lys 


asp 


ala lys ala 


asp 


leu 


his 


ser 


ai 7 

^3 — J 


ala 


gin 


1381/461 
















1411/471 














ATC ATG GCC 


GAC 


ACC 


GGA 


CTG 


GCC 


TAC 


TAT 


TCC GGC GAC 


GAC 


GCG 


CTC 


AAC 


CTG 


CCC 


TGG 


ile met ala 


asp 


thr 


gly 


leu 


ala 


tyr 


tyr 


ser gly asp 


asp 


ala 


leu 


asn 


leu 


d ro 


tro 


1441/481 
















1471/491 














CTG GCC ATG 


GGC 


GCC 


ACG 


GGC 


TTC 


ATC 


AGC 


GTG ATT GCC 


CAC 


CTG 


GCA 


GCC 


GGG 


CAG 


CTT 


leu ala met 


gly 


ala 


thr 


gly phe 


ile 


ser 


val ile ala 


his 


leu 


ala 


ala 


gly 


gin 


leu 


1501/501 
















1531/511 












CGA GAG TTG 


TTG 


TCC 


GCC 


TTC 


GGT 


TCT 


GGG 


GAT ATC GCC 


ACC 


GCC 


CGC 


AAG 


ATC 


AAC 


ATT 


arg glu leu 


leu 


ser 


ala 


phe 


gly 


ser 


gly 


asp ile ala 


thr 


ala 


arg 


lys 


ile 


asn 


ile 


1561/521 
















1591/531 












GCG GTC GCC 


CCG 


CTG 


TGC 


AAC 


GCG 


ATG 


AGC 


CGC CTG GGT 


GGG 


GTG 


ACG 


TTG 


TCC 


AAG 


GCG 


ala val ala 


pro 


leu 


cys 


asn 


ala 


met 


ser 


arg leu gly 


gly 


val 


thr 


leu 


ser 


lys 


ala 


1621/541 
















1651/551 














GGC TTG CGG 


CTG 


CAG 


GGC 


ATC 


GAC 


GTC 


GGT 


GAT CCC CGG 


CTG 


CCC 


CAG 


GTG 


GCC 


GCG 


ACA 


gly leu arg 


leu 


gin 


gly 


ile 


asp 


val 


gly 


asp pro arg 


leu 


pro 


gin 


val 


ala 


ala 


thr 


1681/561 
















1711/571 














CCG GAG CAG 


ATC 


GAC 


GCG 


TTG 


GCC 


GCC 


GAC 


ATG CGC GCG 


GCC 


TCG 


GTG 


CTT 


CGG 


TGA 




pro glu gin 


ile 


asp 


ala 


leu 


ala 


ala 


asp 


met arg ala 


ala 


ser 


val 


leu 


arg 


OPA 





SEQ ID N° 37F (suite 1) 
FIGURE 37F (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PO7FR98/01813 



1/1 












GCG GTG 


AAC 


TGG 


TGG 


GCC 


CGG 


ala val 


asn 


trp 


trp 


ala 


ara 


61/21 










AGA CGA 


CGG 


ATG 


GAA 


GGA 


GAT 


arg arg 


arg 


met 


glu 


al v 
\j j. j 


aso 


121/41 












TCG TCG 


TCT 


ACG 


GAG 


GTG 


AAG 


ser ser 


ser 


thr 


glu 


val 


lys 


181/61 












ACT GGC 


CCG 


CAG 


GTG 


AAG 


GCG 


thr gly pro 


gin val 


lys 


ala 


241/81 












GAC GCG 


TGC 


CCA 


GAA 


CAG 


GCC 


asp ala 


cys 


pro 


glu 


gin 


ala 


301/101 












CTT GTT 


GGC 


ATT 


GCG 


GCG 


ACG 


leu val 


gly 


ile 


ala 


ala 


thr 


361/121 












TTT GCG 


TTG 


CGC 


TCA 


CAC 


CAG 


phe ala 


leu 


arg 


ser 


his 


gin 


421/141 












GAG GCC 


GCT 


AAG 


GAT 


TGC 


GTT 


glu ala 


ala 


lys 


asp 


cys 


val 


481/161 












AGC ATG 


CAG 


AAG 


ATC 






ser met 


gin 


lys 


ile 







1/1 

CAG CGG TGA ACT GGT GGG CCC 
gin arg OPA thr gly gly oro 
61/21 

GGA GAC GAC GGA TGG AAG GAG 
gly asp asp gly trp lys glu 
121/41 

AGT CGT CGT CTA CGG AGG TGA 
ser arg arg leu arg arg OPA 
181/61 

AGA CTG GCC CGC AGG TGA AGG 
arg leu ala arg arg OPA arg 
241/81 

AGG ACG CGT GCC CAG AAC AGG 
arg thr arg ala gin asn arg 
301/101 

GGC TTG TTG GCA TTG CGG CGA 
gly leu leu ala leu arg arg 
361/121 

ATT TTG CGT TGC GCT CAC ACC 
ile leu arg cys ala his thr 
421/141 

TTG AGG CCG CTA AGG ATT GCG 
leu arg pro leu arg ile ala 
481/161 

CTA GCA TGC AGA AGA TC 
leu ala cys arg arg 



120/185 









31/11 






ATG 


GTT 


CAA 


GTA CGC 


CGT 


CGC 


me t 


val 


gin 


val arg 


arg 


arg 








91/31 






GCT 


GGC 


GCC 


GGC CAG 


CTG 


AAC 


ala 


al v 

y x y 


ala 














151/51 






GCG 


GCG 


GAT 


TCG GCG 


GAA 


TCT 


ala 


ala 


asp 


ser ala 


glu 


ser 








211/71 






GCG 


GAT 


TCG 


GCG GAA 


TCT 


GAC 


al a 


asp 


ser 


ala glu 


3e r 


asp 








271/91 






CTC 


GTC 


GAG 


CGG CGC 


CCG 


TCG 


leu 


val 


glu 


arg arg 


pro 


ser 








331/111 






CTG 


CTC 


GCG 


TTG GCC 


GGT 


GGC 


leu 


leu 


ala 


leu ala 


gly 


gly 








391/131 






GAA 


AGC 


CAA 


TCA ATC 


GCG 


CGC 


glu 


ser 


gin 


ser ile 


ala 


arg 








451/151 






GCG 


GCC 


ACG 


CAG GCA 


CCC 


GAT 


ala 


ala 


thr 


gin ala 


pro 


asp 



SEQ ID N° 38A 
FIGURE 38A 









31/11 






GGA 


TGG 


TTC 


AAG TAC 


GCC 


GTC 


gly 


trp 


phe 


lys tyr 


ala 


val 








91/31 






ATG 


CTG 


GCG 


CCG GCC 


AGC 


TGA 


met 


leu 


ala 


pro ala 


ser 


OPA 








151/51 






AGG 


CGG 


CGG 


ATT CGG 


CGG 


AAT 


arg 


arg 


arg 


ile arg 


arg 


asn 








211/71 






CGG 


CGG 


ATT 


CGG CGG 


AAT 


CTG 


arg 


arg 


ile 


arg arg 


asn 


leu 








271/91 






CCC 


TCG 


TCG 


AGC GGC 


GCC 


CGT 


pro 


ser 


3er 


ser gly 


ala 


arg 








331/111 






CGC 


TGC 


TCG 


CGT TGG 


CCG 


GTG 


arg 


cys 


ser 


arg trp 


pro 


val 








391/131 






AGG 


AAA 


GCC 


AAT CAA 


TCG 


CGC 


arg 


lys 


ala 


asn gin 


ser 


arg 








451/151 






TTG 


CGG 


CCA 


CGC AGG 


CAC 


CCG 


leu 


arg 


pro 


arg arg 


his 


pro 



AAA 
lys 


CTC 
leu 


GAG 
glu 


CAC 
hi 3 


AAC 
asn 


AGG 
arg 


CCT 
pro 


GCC 
ala 


GAT 
asp 


GCG 
ala 


AAT 
asn 


AAG 
lya 


GAC 
asp 


GCC 
ala 


GGA 
gly 


GCC 
ala 


GAC 
asp 


CAG 
gin 


GCC 
ala 


GGA 
gly 


GAG 
glu 


CTC GGC 
leu gly 


GAG 
glu 


CGG 
arg 


TTG 
leu 


CGG 
arg 


CGA GGC 
arg gly 


TGG 
trp 


CTT 
leu 


GGC 
al v 


GCA 
ala 


GCG 
al a 


GGT 

ol V 

y x y 


TAT 

tyr 


GAG 
glu 


GAC 
asp 


CTT 

leu 


GCG 
ala 


GCC 

ala 


ATT 
ile 


GCT 
ala 


GGG 
gly 


GCG 
ala 


ATG 
me t 


TCG 
ser 


GCT 
ala 


GCA 
ala 


AAC 
asn 


TCG 
ser 


AGC 
ser 


ACA 
thr 


ACA 
thr 


ACC 
thr 


CTG 
leu 


CCG 
pro 


ATG 
met 


CGA 
arg 


ATA 
ile 


CTG 
leu 


ACG 
thr 


CCG 
pro 


GAG 
glu 


CCG 
pro 


ACC 
thr 


ACG 
thr 


CCG 
pro 


GAG 
glu 


AGC 
ser 


TCG 
ser 


GCG 
ala 


CGC 
arg 


GGT 
gly 


TGC 

cys 


GGC 
gly 


GAG 
glu 


GCT 
ala 


GCC 
ala 


TTG 

leu 


GCG 
ala 


CAG 

gin 


CGG 
arg 


GTT 

val 


GCG 
ala 


AGG 
arg 


ACC 
thr 


TTG 
leu 


CGG 
arg 


CCA 
pro 


ATG 
me t 


CTG 
leu 


GGG 
gly 


CGA 
arg 


TGT 
cys 


CGG 
arg 



SEQ ID N° 38B 
FEUILLE DE RENff>l3l©BUI@tfP(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



121/185 



1/1 


















AGC GGT 


GAA 


CTG 


GTG 


GGC 


CCG 


GAT 


GGT 


TCA 


ser gly 
61/21 


glu 


leu 


val 


gly 


pro 


asp 


gly 


ser 


GAG ACG 


ACG 


GAT 


GGA 


AGG 


AGA 


TGC 


TGG 


CGC 


glu thr 
121/41 


thr 


asp 


gly 


arg 


arg 


cys 


trp 


arg 


GTC GTC 


GTC 


TAC 


GGA 


GGT 


GAA 


GGC 


GGC 


GGA 


val val 
181/61 


val 


tyr 


gly 


gly 


glu 


gly 


gly 


gly 


GAC TGG 


CCC 


GCA 


GGT 


GAA 


GGC 


GGC 


GGA 


TTC 


asp trp 
241/81 


pro 


ala 


gly 


glu 


gly 


gly 


giy 


phe 


GGA CGC 


GTG 


CCC 


AGA 


ACA 


GGC 


CCT 


CGT 


CGA 


gly arg 
301/101 


val 


pro 


arg 


thr 


gly 


pro 


arg 


arg 


GCT TGT 


TGG 


CAT 


TGC 


GGC 


GAC 


GCT 


GCT 


CGC 


ala cys 
361/121 


trp 


his 


cys 


gly 


asp 


ala 


ala 


arg 


TTT TGC 


GTT 


GCG 


CTC 


ACA 


CCA 


GGA 


AAG 


CCA 


phe cys 
421/141 


val 


ala 


leu 


thr 


pro 


gly 


lys 


pro 


TGA GGC 


CGC 


TAA 


GGA 


TTG 


CGT 


TGC 


GGC 


CAC 


OPA gly 
481/161 


arg 


OCH 


gly 


leu 


arg 


cys 


gly 


his 


TAG CAT 


GCA 


GAA 


GAT 


C 










AMB his 


ala 


glu 


asp 













31/11 



AGT ACG 


CCG 


TCG 


CAA 


ACT 


CGA 


GCA 


CAA 


CAG 


ser thr 

91/31 


pro 


ser 


gin 


thr 


arg 


ala 


gin 


gin 


CGG CCA 


GCT 


GAA 


CCC 


TGC 


CGA 


TGC 


GAA 


TAA 


arg pro 
151/51 


ala 


glu 


pro 


cys 


arg 


cys 


glu 


OCH 


TTC GGC 


GGA 


ATC 


TGA 


CGC 


CGG 


AGC 


CGA 


CCA 


phe gly 
211/71 


gly 


ile 


OPA 


arg 


arg 


ser 


arg 


pro 


GGC GGA 


ATC 


TGA 


CGC 


CGG 


AGA 


GCT 


CGG 


CGA 


gly gly 
271/91 


ile 


OPA 


arg 


arg 


arg 


ala 


arg 


arg 


GCG GCG 


CCC 


GTC 


GCG 


GTT 


GCG 


GCG 


AGG 


CTG 


ala ala 
331/111 


pro 


val 


ala 


val 


ala 


ala 


arg 


leu 


GTT GGC 


CGG 


TGG 


CCT 


TGG 


CGC 


AGC 


GGG 


TTA 


val gly 
391/131 


arg 


trp 


pro 


trp 


arg 


ser 


gly 


leu 


ATC AAT 


CGC 


GCG 


CGA 


GGA 


CCT 


TGC 


GGC 


CAT 


ile asn 
451/151 


arg 


ala 


arg 


gly 


pro 


cys 


gly 


his 


GCA GGC 


ACC 


CGA 


TGC 


TGG 


GGC 


GAT 


GTC 


GGC 


ala gly 


thr 


arg 


cys 


trp 


gly 


asp 


val 


gly 



SEQ ID N° 38C 
FIGURE 38C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



122/185 



Sequence Rv0175 


seq38A 






1/1 






GTG AAG 


GCG 


GCG 


val lys 


ala 


ala 


61/21 






AAG GCG 


GCG 


GAT 


lys ala 


ala 


asp 


121/41 






CAG GCC 


CTC 


GTC 


gin ala 


leu 


val 


181/61 






GCG ACG 


CTG 


CTC 


ala thr 


leu 


leu 


241/81 






CAC CAG 


GAA 


AGC 


his gin 


glu 


ser 


301/101 






TGC GTT 


GCG 


GCC 


cys val 


ala 


ala 


361/121 






ATC GAG 


TGT 


GGC 


ile glu 


cys 


gly 


421/141 






GAG GCG 


TAT 


CAA 


glu ala 


tyr 


gin 


481/161 






CGC AAC 


AAC 


AAT 


arg asn 


asn 


asn 


541/181 






ACC GAC 


TCG 


GAT 


thr asp 


ser 


asp 


601/201 






GGC CGC 


TAT 


AAG 


gly arg 


tyr 


lys 



predite par Col 



GAT TCG GCG GAA 
asp ser ala glu 

TCG GCG GAA TCT 
ser ala glu ser 

GAG CGG CGC CCG 
glu arg arg pro 

GCG TTG GCC GGT 
ala leu ala gly 

CAA TCA ATC GCG 
gin ser ile ala 

ACG CAG GCA CCC 
thr gin ala pro 

ACC GGT GAT TTC 
thr gly asp phe 

GCG GCC AGC GTC 
ala ala ser val 

GAC GGG TCG GTC 
asp gly ser val 

GCC CAT GAA GTC 
ala his glu val 

ATC GCC AAA CTC 
ile ala lys leu 



2 et 


al. 


, 1998 






31/11 


TCT 


GAC 


GCC GGA 


ser 


asp 


ala gly 






91/31 


GAC 


GCC 


GGA GAG 


asp 


ala 


gly glu 






151/51 


TCG 


CGG 


TTG CGG 


ser 


arg 


leu arg 






211/71 


GGC 


CTT 


GGC GCA 


gly 


leu 


gly ala 






271/91 


CGC 


GAG 


GAC CTT 


arg 


glu 


asp leu 






331/111 


GAT 


GCT 


GGG GCG 


asp 


ala 


gly ala 






391/131 


GGT 


GCC 


CAG GCG 


gly 


ala 


gin ala 






451/151 


CAC 


GTG 


CAA GTG 


his 


val 


gin val 






511/171 


GAT 


GTT 


CTG GTG 


asp 


val 


leu val 






571/191 


GGC 


TAC 


CGT CTT 


gly 


tyr 


arg leu 






631/211 


GAC 


CAG 


GTG ACG 


asp 


gin 


val thr 



SEQ ID N° 38D 
FIGURE 38D 



Nature 393 537- 



GCC GAC CAG ACT 
ala asp gin thr 

CTC GGC GAG GAC 
leu gly glu asp 

CGA GGC TGG CTT 
arg gly trp leu 

GCG GGT TAT TTT 
ala gly tyr phe 

GCG GCC ATT GAG 
ala ala ile glu 

ATG TCG GCT AGC 
met ser ala ser 

TCG TTG TAC ACC 
ser leu tyr thr 

ACC GAT ATG CGC 
thr asp met arg 

GCG CTC CGG GTC 
ala leu arg val 

CGG GTC CGG ATG 
arg val arg met 

AAG TGA 
lys OPA 



44) et contenant 



GGC CCG CAG GTG 
gly pro gin val 

GCG TGC CCA GAA 
ala cys pro glu 

GTT GGC ATT GCG 
val gly ile ala 

GCG TTG CGC TCA 
ala leu arg ser 

GCC GCT AAG GAT 
ala ala lys asp 

ATG CAG AAG ATC 
met gin lys ile 

AGC ATG CTC GTC 
ser met leu val 

GCG GCG GTC GAG 
ala ala val glu 

AAG GTG TCC AAC 
lys val ser asn 

GCA CTG GAT GAG 
ala leu asp glu 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



123/185 



ORF d'apres Cole et al . , 1998 (Nature 393 537-544) Contenant Rv0175 
1/1 31/11 

TGA ACT GGT GGG GCC GGA TGG TGT CAA GTA CGC CGT CGC AAA CTC GAG CAC AAC AGG AGA 
OPA thr gly gly ala gly trp cys gin val arg arg arg lys leu glu his asn arq arq 
61/21 91/31 

CGA CGG ATG GAA GGA GAT GCT GGC GCC GGC CAG CTG AAC CCT GCC GAT GCG AAT AAG TCG 
arg arg met glu gly asp ala gly ala gly gin leu asn pro ala asp ala asn lys ser 
121/41 151/51 

TCG TCT ACG GAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GCC GAC CAG ACT 
ser ser thr glu val lys ala ala asp ser ala glu ser aso ala gly ala aso gin thr 
181/61 211/71 

GGC CCG CAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GAG CTC GGC GAG GAC 
gly pro gin val lys ala ala asp ser ala glu ser asp ala gly glu leu glv qlu asp 
241/81 271/91 

GCG TGC CCA GAA CAG GCC CTC GTC GAG CGG CGC CCG TCG CGG TTG CGG CGA GGC TGG CTT 
ala cys pro glu gin ala leu val glu arg arg pro ser arg leu arg arg gly trp leu 
301/101 331/111 

GTT GGC ATT GCG GCG ACG CTG CTC GCG TTG GCC GGT GGC CTT GGC GCA GCG GGT TAT TTT 
val gly ile ala ala thr leu leu ala leu ala gly gly leu gly ala ala glv tyr phe 
361/121 391/131 

GCG TTG CGC TCA CAC CAG GAA AGC CAA TCA ATC GCG CGC GAG GAC CTT GCG GCC ATT GAG 
ala leu arg ser his gin glu ser gin ser ile ala arg glu asp leu ala ala ile qlu 
421/141 451/151 

GCC GCT AAG GAT TGC GTT GCG GCC ACG CAG GCA CCC GAT GCT GGG GCG ATG TCG GCT AGC 
ala ala lys asp cys val ala ala thr gin ala pro asp ala gly ala met ser ala ser 
481/161 511/171 

ATG CAG AAG ATC ATC GAG TGT GGC ACC GGT GAT TTC GGT GCC CAG GCG TCG TTG TAC ACC 
met gin lys ile ile glu cys gly thr gly asp phe gly ala gin ala ser leu tyr thr 
541/181 571/191 

AGC ATG CTC GTC GAG GCG TAT CAA GCG GCC AGC GTC CAC GTG CAA GTG ACC GAT ATG CGC 
ser met leu val glu ala tyr gin ala ala ser val his val gin val thr asn met arg 
601/201 631/211 

GCG GCG GTC GAG CGC AAC AAC AAT GAC GGG TCG GTC GAT GTT CTG GTG GCG CTC CGG GTC 
ala ala val glu arg asn asn asn asp gly ser val aso val leu val ala leu arg val 
661/221 691/231 

AAG GTG TCC AAC ACC GAC TCG GAT GCC CAT GAA GTC GGC TAC CGT CTT CGG GTC CGG ATG 
lys val ser asn thr asp ser asp ala his glu val gly tyr arg leu arg val arq met 
721/241 751/251 

GCA CTG GAT GAG GGC CGC TAT AAG ATC GCC AAA CTC GAC CAG GTG ACG AAG TGA 
ala leu asp glu gly arg tyr lys ile ala lys leu asp gin val thr lys OPA 



SEQ ID N° 38F 
FIGURE 38F 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/018I3 



124/185 



1/1 


















31/11 


















ACA CCT 


CCC 


CCC 


CCG 


CCG 


CCG 


CTG 


CCG 


CCG 


GTT CCC 


TTT 


CCC 


AAG 


GAA 


TGT 


CCG 


GCG 


CCG 


thr pro 


pro 


pro 


pro 


pro 


pro 


leu 


pro 


pro 


val pro 


phe 


pro 


lys 


glu 


cys 


pro 


ala 


pro 


61/21 


















91/31 








GGC GTG 


ATG 


CAA 


GGC 


TGC 


CTT 


GAG 


AGC 


ACC 


AGC GGC 


TTG 


ATC 


ATG 


GGC 


ATC 


GAC 


AGC 


AAG 


gly val 


met 


gin 


gly 


cys 


leu 


glu 


ser 


thr 


ser gly 


leu 


ile 


met 


gly 


ile 


asp 


ser 


lys 


121/41 


















151/51 












ACC GCA 


CTG 


GTC 


GCC 


GAG 


CGC 


ATC 


ACC 


GGT 


GCC GTC 


GAG 


GAG 


ATC 












thr ala 


leu 


val 


ala 


glu 


arg 


ile 


thr 


gly 


ala val 


glu 


glu 


ile 













SEQ ID N° 39A 
FIGURE 39A 



1/1 


















31/11 


















CAC CTC 


CCC 


CCC 


CGC 


CGC 


CGC 


TGC 


CGC 


CGG 


TTC CCT 


TTC 


CCA 


AGG 


AAT 


GTC 


CGG 


CGC 


CGG 


his leu 


pro 


pro 


arg 


arg 


arg 


cys 


arg 


arg 


phe pro 


phe 


pro 


arg 


asn 


val 


arg 


arg 


arg 


61/21 


















91/31 










GCG TGA 


TGC 


AAG 


GCT 


GCC 


TTG 


AGA 


GCA 


CCA 


GCG GCT 


TGA 


TCA 


TGG 


GCA 


TCG 


ACA 


GCA 


AGA 


ala OPA 


cys 


lys 


ala 


ala 


leu 


arg 


ala 


pro 


ala ala 


OPA 


ser 


trp 


ala 


ser 


thr 


ala 


arg 


121/41 


















151/51 














CCG CAC 


TGG 


TCG 


CCG 


AGC 


GCA 


TCA 


CCG 


GTG 


CCG TCG 


AGG 


AGA 


TC 












pro his 


trp 


ser 


pro 


ser 


ala 


ser 


pro 


val 


pro ser 


arg 


arg 















SEQ ID N° 39B 
FIGURE 39B 



1/1 


















31/11 


















GAC ACC 


TCC 


CCC 


CCC 


GCC 


GCC 


GCT 


GCC 


GCC 


GGT TCC 


CTT 


TCC 


CAA 


GGA 


ATG 


TCC 


GGC 


GCC 


asp thr 


ser 


pro 


pro 


ala 


ala 


ala 


ala 


ala 


gly ser 


leu 


ser 


gin 


gly 


met 


ser 


gly 


ala 


61/21 


















91/31 














GGG CGT 


GAT 


GCA 


AGG 


CTG 


CCT 


TGA 


GAG 


CAC 


CAG CGG 


CTT 


GAT 


CAT 


GGG 


CAT 


CGA 


CAG 


CAA 


gly arg 


asp 


ala 


arg 


leu 


pro 


OPA glu 


his 


gin arg 


leu 


asp 


his 


gly 


his 


arg 


gin 


gin 


121/41 


















151/51 














GAC CGC 


ACT 


GGT 


CGC 


CGA 


GCG 


CAT 


CAC 


CGG 


TGC CGT 


CGA 


GGA 


GAT 


C 










asp arg 


thr 


gly 


arg 


arg 


ala 


his 


his 


arg 


cys arg 


arg 


gly 


asp 













SEQ ID N° 39C 
FIGURE 39C 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



125/185 



Sequence codante Rv300 6 
3eq39A 

1/1 

ATG TGG ACA ACG CGG TTG 
Met trp thr thr arg leu 
61/21 

TCG AGO GGC TGC GCA CGG 
ser ser gly cys ala arg 
121/41 

CTG CGG CCC CAA CCC AGC 
leu arg pro gin pro ser 
181/61 

CCC AAG GAA TGT CCG GCG 
pro lys glu cys pro ala 
241/81 

ATC ATG GGC ATC GAC AGC 
ile met gly ile asp ser 
301/101 

GAG ATC TCT ATC AGC GCC 
glu ile ser ile ser ala 
361/121 

GAC GGT GGC TTG ATG GAC 
asp gly gly leu met asp 
421/141 

GCC TAC ATC AGC ACG CCC 
ala tyr ile ser thr pro 
481/161 

AAG GAC ATC CTG ACC GGC 
lys asp ile leu thr gly 
541/181 

ACC AGT CCC ACC ACG CTG 
thr ser pro thr thr leu 
601/201 

GAT CCC CAA TCG TTG GCC 
asp pro gin ser leu ala 
661/221 

ACG CCG CCG ACG ACG GCG 
thr pro pro thr thr ala 
721/241 

GTC GAC GGC TCG CTA TAT 
val asp gly ser leu tyr 
781/261 

ACC AAG AAC TCG GAG GTC 
thr lys asn ser glu val 
841/281 

TGT GCC GCG ATG GAC GGC 
cys ala ala met asp gly 
901/301 

GTC CGG CTC GCG CCG TCG 
val arg leu ala pro ser 
961/321 

ACT CAT GCG CAT GCG TGG 
thr his ala his ala trp 
1021/341 

GTC AAC AAG ACC GCC GGC 
val asn lys thr ala gly 
1031/361 

CAG GGT GGC GGC TTC CCG 
gin gly gly gly pne pro 



predite 


par 


Cole et al 


, 1 










31/11 




GTT 


CGA 


TCC 


GGA 


CTC GCC 


GCG 


val 


arg 


3er 


al v 


leu ala 


ala 










91/31 




TTC 


AAC 


GAC 


GCT 


CAA TCT 


CAG 


phe 


asn 


asp 


ala 


gin ser 


gin 










151/51 




TCG 


ACA 


CCT 


CCC 


CCC CCG 


CCG 


ser 


thr 


pro 


Dro 


pro pro 


pro 










211/71 




CCG 


GGC 


GTG 


ATG 


CAA GGC 


TGC 


pro 


gly 


val 


met 


aln alv 


cys 










271/91 




AAG 


ACC 


GCA 


CTG 


GTC GCC 


GAG 


lys 


thr 


ala 


leu 


val ala 


glu 










331/111 




GAG 


CCG 


AAG 


GTA 


AAG ACG 


GTC 


glu 


pro 


lys 


val 


lys thr 


val 










391/131 




ATT 


GTG 


CTG 


TCG 


CCC ACC 


TAC 


ile 


val 


leu 


ser 


pro thr 


tyr 










451/151 




ACC 


GAC 


AAC 


CGG 


GTG GTG 


CGA 


thr 


asp 


asn 


arg 


val val 


arg 










511/171 




ATC 


CCC 


AAA 


GGT 


GCT GCC 


GGT 


ile 


pro 


ly3 


gly 


ala ala 


gly 










571/191 




GTC 


GTG 


ATG 


ACC 


GGG GAT 


GCT 


val 


val 


met 


thr 


gly asp 


ala 










6317211 




GGT 


AAG 


GTC 


CTG 


CGT ATC 


GAA 


gly 


lys 


val 


leu 


arg lie 


glu 










691/231 




CTG 


TCT 


GGC 


ATC 


GGC TCC 


GGC 


leu 


ser 


gly 


lie 


gly ser 


alv 










751/251 




GTC 


GCC 


GAC 


CGC 


ACG CCA 


ACG 


val 


ala 


asp 


arg 


thr pro 


thr 










811/271 




TCT 


ACG 


GTA 


TGG 


ACC TGG 


CCG 


ser 


thr 


val 


trp 


thr trp 


pro 










871/291 




ACC 


GTG 


CTG 


GTC 


AAC CTG 


ATT 


thr 


val 


leu 


val 


asn leu 


lie 










931/311 




ACC 


GGT 


GCG 


GTC 


ACC GGA 


GAA 


thr 


gly 


ala 


val 


thr gly 


glu 










991/331 




GCA 


TTA 


CGG 


ATG 


TCG CCG 


GAC 


ala 


leu 


arg 


met 


ser pro 


asp 










1051/351 


GAC 


GCC 


GAG 


AAG 


CTC GAC 


GAT 


asp 


ala 


glu 


lys 


leu asp 


asp 










1111/371 


CGC 


AAC 


AAC 


GAC 


GAC AAG 


ACC 


arg 


asn 


asn 


asp 


asp lys 


thr 



(Nature 393 537-544) et contenant 



CTG TGC GCG GCA GTG CTG GTA 
leu cys ala ala val leu val 

CCG TTC ACC ACC GAA CCG GAG 
pro phe thr thr glu pro glu 

CCG CTG CCG CCG GTT CCC TTT 
pro leu pro pro val pro phe 

CTT GAG AGC ACC AGC GGC TTG 
leu glu ser thr ser gly leu 

CGC ATC ACC GGT GCC GTC GAG 
arg ile thr gly ala val glu 

ATC CCC GTG GAT CCT GCC GGT 
ile pro val asp pro ala gly 

TCG CAA GAC CGG CTG ATG TAC 
ser gin asp arg leu met tyr 

GTG GCC GAC GGC GAC ATC CCC 
val ala asp gly asp ile pro 

AAC ACC GGG GCG CTG ATC TTC 
asn thr gly ala leu ile phe 

GGC GAC CCG GCG TTG GCC GCC 
gly asp pro ala leu ala ala 

CAG CCC ACC ACC ATC GGC CAG 
gin pro thr thr ile gly gin 

GGC GGC TTG TGC ATC GAT CCG 
gly gly leu cys ile asp pro 

GCG GAC CGA TTG CAG CGC ATC 
ala asp arg leu gin arg ile 

GAC AAG CCC GGC GTG GCC GGG 
asp lys pro gly val ala gly 

AAT ACC AAA CTG ACG GTG GCG 
asn thr lys leu thr val ala 

CCC GAC GTT GTC CGC AAA GAC 
pro asp val val arg lys asp 

GGC AAC GTC TGG GGA GCC ACC 
gly asn val trp gly ala thr 

GTG GTG TTC CCG CTG TTC CCG 
val val phe pro leu phe pro 

TGA 
OPA 



SEQ ID N° 39D 



FIGURE 39D 
FEUILLE DE REMPLACEMENT {REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



126/185 



ORF d'apres Cole et al., 1998 {Nature 393 537-544) et contenant Rv3006 
1/1 31/11 

TAA GGC CAT TTA GTG CCG AAT TGG GGA TTT GAG CGG CGC TTT CGC CAG ACA ATC CGC ACA 
OCH gly his leu val pro asn trp gly phe glu arg arg phe arg gin thr ile arg thr 
61/21 91/31 

TTG ACC CTG ACC AGC CCA CCA AAA GGC CCC AAT TGG GCC GCC ATG CCG ACA GTG CGC ACC 
leu thr leu thr ser pro pro lys gly pro asn trp ala ala met pro thr val arg thr 
121/41 151/51 

CCG GCA GGT GGC GGC GAT GCC CAC AAT GTC CGT AGC CTG TCG GTC ATG TGG ACA ACG CGG 
pro ala gly gly gly asp ala his asn val arg ser leu ser val met trp thr thr arg 
181/61 211/71 

TTG GTT CGA TCC GGA CTC GCC GCG CTG TGC GCG GCA GTG CTG GTA TCG AGC GGC TGC GCA 
leu val arg ser gly leu ala ala leu cys ala ala val leu val ser ser gly cys ala 
241/81 271/91 

CGG TTC AAC GAC GCT CAA TCT CAG CCG TTC ACC ACC GAA CCG GAG CTG CGG CCC CAA CCC 
arg phe asn asp ala gin ser gin pro phe thr thr glu oro glu leu arg pro gin Dro 
301/101 331/111 

AGC TCG ACA CCT CCC CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT CCC AAG GAA TGT CCG 
ser ser thr pro pro pro pro pro pro leu pro pro val pro phe Dro lys glu cys pro 
361/121 391/131 

GCG CCG GGC GTG ATG CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG ATC ATG GGC ATC GAC 
ala pro gly val met gin gly cys leu glu ser thr ser gly leu ile met gly ile asp 
421/141 451/151 

AGC AAG ACC GCA CTG GTC GCC GAG CGC ATC ACC GGT GCC GTC GAG GAG ATC TCT ATC AGC 
ser lys thr ala leu val ala glu arg ile thr gly ala val glu glu ile ser ile ser 
481/161 511/171 

GCC GAG CCG AAG GTA AAG ACG GTC ATC CCC GTG GAT CCT GCC GGT GAC GGT GGC TTG ATG 
ala glu pro lys val lys thr val ile pro val aso pro ala gly asp gly gly leu met 
541/181 571/191 

GAC ATT GTG CTG TCG CCC ACC TAC TCG CAA GAC CGG CTG ATG TAC GCC TAC ATC AGC ACG 
asp ile val leu ser pro thr tyr ser gin asp arg leu met tyr ala tyr ile ser thr 
601/201 631/211 

CCC ACC GAC AAC CGG GTG GTG CGA GTG GCC GAC GGC GAC ATC CCC AAG GAC ATC CTG ACC 
pro thr asp asn arg val val arg val ala asp gly asp ile pro lys asp ile leu thr 
661/221 691/231 

GGC ATC CCC AAA GGT GCT GCC GGT AAC ACC GGG GCG CTG ATC TTC ACC AGT CCC ACC ACG 
gly ile pro iys gly ala ala gly asn thr gly ala leu ile phe thr ser pro thr thr 
721/241 751/251 

CTG GTC GTG ATG ACC GGG GAT GCT GGC GAC CCG GCG TTG GCC GCC GAT CCC CAA TCG TTG 
leu val val met thr gly asp ala gly asp pro ala leu ala ala asp pro gin ser leu 
781/261 811/271 

GCC GGT AAG GTC CTG CGT ATC GAA CAG CCC ACC ACC ATC GGC CAG ACG CCG CCG ACG ACG 
ala gly lys val leu arg ile glu gin pro thr thr ile gly gin thr pro pro thr thr 
841/281 871/291 

GCG CTG TCT GGC ATC GGC TCC GGC GGC GGC TTG TGC ATC GAT CCG GTC GAC GGC TCG CTA 
ala leu ser gly ile gly ser gly gly gly leu cvs lie aso Dro val aso gly ser leu 
901/301 931/311 

TAT GTC GCC GAC CGC ACG CCA ACG GCG GAC CGA TTG CAG CGC ATC ACC AAG AAC TCG GAG 
tyr val aia asp arg thr pro thr ala asp arg leu gin arg ile thr lys asn ser glu 



SEQ ID N° 39F 
FIGURE 39F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



127/185 



961/321 
















991/331 
















GTC TCT ACG 


GTA 


TGG 


ACC 


TGG 


CCG 


GAC 


AAG 


CCC GGC GTG 


GCC 


GGG 


TGT 


GCC 


GCG 


ATG 


GAC 


val ser thr 


val 


trp 


thr 


trp 


pro 


asp 


lys 


pro gly val 


ala 


gly 


cys 


ala 


ala 


met 


asp 


1021/341 
















1051/351 










GGC ACC GTG 


CTG 


GTC 


AAC 


CTG 


ATT 


AAT 


ACC 


AAA CTG ACG 


GTG 


GCG 


GTC 


CGG 


CTC 


GCG 


CCG 


gly thr val 


leu 


val 


asn 


leu 


ile 


asn 


thr 


lys leu thr 


val 


ala 


val 


arg 


leu 


ala 


pro 


1081/361 
















1111/371 












TCG ACC GGT 


GCG 


GTC 


ACC 


GGA 


GAA 


ccc 


GAC 


GTT GTC CGC 


AAA 


GAC 


ACT 


CAT 


GCG 


CAT 


GCG 


ser thr gly 


ala 


val 


thr 


gly 


glu 


pro 


asp 


val val arg 


lys 


asp 


thr 


his 


ala 


his 


ala 


1141/381 
















1171/391 












TGG GCA TTA 


CGG 


ATG 


TCG 


CCG 


GAC 


GGC 


AAC 


GTC TGG GGA 


GCC 


ACC 


GTC 


AAC 


AAG 


ACC 


GCC 


trp ala leu 


arg 


met 


ser 


pro 


asp 


gly 


asn 


val trp gly 


ala 


thr 


val 


asn 


lys 


thr 


ala 


1201/401 
















1231/411 














GGC GAC GCC 


GAG 


AAG 


CTC 


GAC 


GAT 


GTG 


GTG 


TTC CCG CTG 


TTC 


CCG 


CAG 


GGT 


GGC 


GGC 


TTC 


gly asp ala 


glu 


lys 


leu 


asp 


asp 


val 


val 


phe pro leu 


phe 


pro 


gin 


gly 


gly 


gly 


phe 


1261/421 
























CCG CGC AAC 


AAC 


GAC 


GAC 


AAG 


ACC 


TGA 




















pro arg asn 


asn 


asp 


asp 


lys 


thr 


OPA 





















SEQ ID N° 39F (suite) 
FIGURE 39F (suite) 



1/1 


















31/11 


















GAA GGC 


CTT 


GTT 


GAG 


CCG 


GCG 


CAC 


GAA 


AAC 


GAT CGT 


TGT 


GTG 


TAC 


ATT 


GGT 


GTG 


TAT 


GGC 


glu gly 


leu 


val 


glu 


pro 


ala 


his 


glu 


asn 


asp arg 


cys 


val 


tyr 


ile 


gly 


val 


tyr 


gly 


61/21 


















91/31 












TCG GTT 


GAA 


CGT 


GTA 


TGT 


GCC 


CGA 


CGA 


ATT 


GGC GGA 


GCG 


CGC 


CAG 


GGC 


GCG 


GGG 


CTT 


GAA 


ser val 


glu 


arg 


val 


cys 


ala 


arg 


arg 


ile 


gly gly 


ala 


arg 


gin 


gly 


ala 


gly 


leu 


glu 


121/41 


















151/51 














CGT CTC 


GGC 


GCT 


GAC 


TCA 


GGC 


CGC 


GAT 


CAG 


TGC CGA 


GTT 


GGA 


GAA 


CTC 


CGC 


AAC 


CGA 


TGC 


arg leu 


gly 


ala 


asp 


ser 


gly 


a rg 


asp 


gin 


cys arg 


val 


gly 


glu 


leu 


arg 


asn 


arg 


cys 


181/61 


















211/71 














GTG GCT 


TGA 


GGG 


GTT 


GGA 


ACC 


CAG 


AAG 


CAC 


CGG CGC 


TCG 


GCA 


TGA 


TGA 


CGT 


GCT 


GGG 


TGC 


val ala 


OPA 


gly 


val 


gly 


thr 


gin 


lys 


his 


arg arg 


ser 


ala 


OPA 


OPA 


arg 


ala 


gly 


cys 


241/81 


















271/91 














GAT CGA 


TGC 


CGC 


TCG 


CGA 


TGA 


GTT 


CGA 


AGC 


GTG AGA 


GCA 


TCG 


CCC 


ACT 


TCG 


CCG 


CCG 


GAG 


asp arg 


cys 


arg 


ser 


arg 


OPA 


val 


arg 


ser 


val arg 


ala 


ser 


pro 


thr 


ser 


pro 


pro 


glu 


301/101 


















331/111 
















CAG GTG 


GTC 


GTC 


GAC 


GCG 


AGT 


GCC 


ATG 


GTG 


GAT C 


















gin val 


val 


val 


asp 


ala 


ser 


ala 


met 


val 


asp 



















SEQ ID N° 40A 
FIGURE 4 OA 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



128/185 



1/1 

AAG GCC TTG TTG AGC CGG CGC 
lys ala leu leu ser arg arg 
61/21 

CGG TTG AAC GTG TAT GTG CCC 
arg leu asn val tyr val pro 
121/41 

GTC TCG GCG CTG ACT CAG GCC 
val ser ala leu thr gin ala 
181/61 

TGG CTT GAG GGG TTG GAA CCC 
trp leu glu gly leu glu pro 
241/81 

ATC GAT GCC GCT CGC GAT GAG 
ile asp ala ala arg asp glu 
301/101 

AGG TGG TCG TCG ACG CGA GTG 
arg trp ser ser thr arg val 









31/11 




ACG 


AAA 


ACG 


ATC GTT 


GTG 


thr 


1 vs 


thr 


ile val 


va 1 








91/31 




GAC 


GAA 


TTG 


GCG GAG 


CGC 


asp 


glu 


leu 


ala glu 


arg 








151/51 




GCG 


ATC 


AGT 


GCC GAG 


TTG 


ala 


ile 


ser 


ala glu 


leu 








211/71 




AGA 


AGC 


ACC 


GGC GCT 


CGG 


arg 


ser 


thr 


gly ala 


arg 








271/91 




TTC 


GAA 


GCG 


TGA GAG 


CAT 


phe 


glu 


ala 


OPA glu 


his 








331/111 




CCA 


TGG 


TGG 


ATC 




pro 


trp 


trp 


ile 





SEQ ID N° 40B 
FIGURE 40B 



TGT ACA TTG GTG TGT ATG GCT 
cys thr leu val cys met ala 

GCC AGG GCG CGG GGC TTG AAC 
ala arg ala arg gly leu asn 

GAG AAC TCC GCA ACC GAT GCG 
glu asn ser ala thr asp ala 

CAT GAT GAC GTG CTG GGT GCG 
his asp asp val leu gly ala 

CGC CCA CTT CGC CGC CGG AGC 
arg pro leu arg arg arg ser 



1/1 



AGG CCT 


TGT 


TGA 


GCC 


GGC 


GCA 


CGA 


AAA 


CGA 


arg pro 


cys 


OPA 


ala 


gly 


ala 


arg 


lys 


arg 


61/21 


















GGT TGA 


ACG 


TGT 


ATG 


TGC 


CCG 


ACG 


AAT 


TGG 


gly OPA 


thr 


cys 


met 


cys 


pro 


thr 


asn 


trp 


121/41 


















TCT CGG 


CGC 


TGA 


CTC 


AGG 


CCG 


CGA 


TCA 


GTG 


ser arg 


arg 


OPA 


leu 


arg 


pro 


arg 


ser 


val 


181/61 


















GGC TTG 


AGG 


GGT 


TGG 


AAC 


CCA 


GAA 


GCA 


CCG 


gly leu 


arg 


gly 


trp 


asn 


pro 


glu 


ala 


pro 


241/81 


















TCG ATG 


CCG 


CTC 


GCG 


ATG 


AGT 


TCG 


AAG 


CGT 


ser met 


pro 


leu 


ala 


met 


ser 


ser 


lys 


arg 


301/101 














GGT GGT 


CGT 


CGA 


CGC 


GAG 


TGC 


CAT 


GGT 


GGA 


gly gly 


arg 


arg 


arg 


glu 


cys 


his 


gly 


gly 



31/11 


















TCG TTG 


TGT 


GTA 


CAT 


TGG 


TGT 


GTA 


TGG 


CTC 


ser leu 
91/31 


cys 


val 


his 


trp 


cys 


val 


trp 


leu 


CGG AGC 


GCG 


CCA 


GGG 


CGC 


GGG 


GCT 


TGA 


ACG 


arg ser 
151/51 


ala 


pro 


gly 


arg 


gly 


ala 


OPA 


thr 


CCG AGT 


TGG 


AGA 


ACT 


CCG 


CAA 


CCG 


ATG 


CGT 


pro ser 
211/71 


trp 


arg 


thr 


pro 


gin 


pro 


met 


arg 


GCG CTC 


GGC 


ATG 


ATG 


ACG 


TGC 


TGG 


GTG 


CGA 


ala leu 
271/91 


gly 


met 


met 


thr 


cys 


trp 


val 


arg 


GAG AGC 


ATC 


GCC 


CAC 


TTC 


GCC 


GCC 


GGA 


GCA 


glu ser 


ile 


ala 


his 


phe 


ala 


ala 


gly 


ala 


TC 



















SEQ ID N° 40C 
FIGURE 40C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



129/185 



Sequence codante Rv0549c predite par Cole et al . , 
contenant seq4 0A 



1/1 

gtg aga 
val arg 
61/21 
gat eta 
asp leu 
121/41 
gcg atg 
ala met 
131/61 
cgc gec 
arg ala 
241/81 
ccg gtg 
pro val 
301/101 
etc cgc 
leu arg 
361/121 
acc acc 
thr thr 



1998 (Nature 393 : 537- 54 4 ) et 

















31/11 


















teg 
ser 


ccc 
pro 


act 
thr 


teg 
ser 


ccg 
pro 


ccg 
pro 


gag 
glu 


cag gtg 
gin val 
91/31 


gtc 
va 1 


gtc 
val 


gac 
asp 


gcg 
ala 


agt 
ser 


gee 
ala 


atg 
me t 


gtg 
va 1 


get 
ala 


cgc 
arg 


act 
thr 


age 
ser 


gat 
asp 


egg 
arg 


tgc 
cys 


tct gcg 
ser ala 
151/51 


gtg 
va 1 


cgc 
ara 


gcg 
ala 


egg 
a rg 


ctg 

leu 


get 
ala 


egg 


acc 
thr 


gcg 
ala 


ccg 
pro 


gcg 
ala 


cac 
his 


ttc 
phe 


gat 
asp 


gca 
ala 


gag gtg 
glu val 
211/71 


ttg 

leu 


teg 
ser 


gcg 
ala 


ctg 
leu 


ggg 

gly 


cgc 
arg 


atg 
met 


cag 
gin 


gca 
ala 


etc 
leu 


acc 
thr 


gtt 
val 


gec 
ala 


tat 
tyr 


gtc 
val 


gat gcg 
asp ala 
271/91 


gca 
ala 


ctg 
leu 


gag 
glu 


gag 
glu 


ttg 
leu 


cga 
arg 


cag 
gin 


gtg 
val 


cga 
arg 


cac 
his 


ggt 
gly 


ctt 
leu 


teg 
ser 


teg 
ser 


ctg 
leu 


ctt get 
leu ala 
331/111 


gga 
gly 


gcg 
ala 


tgg 
trp 


teg 
ser 


cgc 
arg 


cgc 
arg 


gac 
asp 


acc 
thr 


acc 
thr 


gat 
asp 


gec 
ala 


etc 
leu 


tac 
tyr 


gtc 
val 


gag 
glu 


ctg gec 
leu ala 
391/131 


gaa 
glu 


acg 
thr 


gca 
ala 


ggt 
gly 


ctg 
leu 


gtg 
val 


ttg 
leu 


ttg 
leu 


gaa 
glu 


aga 
arg 


ttg 
leu 


gca 
ala 


cgc 
arg 


gec 
ala 


tgg 
trp 


ccc teg 
pro ser 


get 
ala 


cac 
his 


gee 
ala 


ate 
ile 


ggc 
gly 


tga 
OPA 







SEQ ID N° 40D 
FIGURE 4 0D 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0549c 



1/1 

tga gtt cga 
OPA val arg 
61/21 

agt gee atg 
ser ala met 
121/41 
ctg get egg 
leu ala arg 
181/61 
ggg cgc atg 
gly arg met 
241/81 
ttg cga 
leu arg 
301/101 
cgc cgc 
arg arg 
361/121 
ctg gtg 
leu val 
421/141 
ggc tga 
gly OPA 



cag 
gin 

gac 
asp 

ttg 
leu 



age 
ser 

gtg 
val 

acc 
thr 

cag 
gin 

gtg 
val 

acc 
thr 

ttg 
leu 



gtg 

val 

gat 
asp 

gcg 
ala 

cgc 
arg 

ccg 
pro 

etc 
leu 

acc 
thr 



aga 
arg 

eta 
leu 

atg 
met 

gec 
ala 

gtg 
val 

cgc 
arg 

acc 
thr 



gca 
ala 

ctg 
leu 



cac 
his 

ggc 
gly 

act 
thr 

ctg 
leu 

gac 
asp 



teg ccc act 
ser pro thr 

get cgc act 
ala arg thr 

gcg ccg gcg 
ala pro ala 

gca etc acc 
ala leu thr 

cga cac ggt 
arg his gly 

acc gat gec 
thr asp ala 

gaa aga ttg 
glu arg leu 



31/11 
teg ccg 
ser pro 
91/31 
age gat 
ser asp 
151/51 
cac ttc 
his phe 
211/71 
gtt gec 
val ala 
271/91 
ctt teg 
leu ser 
331/111 
etc tac 
leu tyr 
391/131 
gca cgc 
ala arg 



ccg 
pro 

egg 
arg 

gat 
asp 

tat 
tyr 

teg 
ser 

gtc 
val 



gag 
glu 

tgc 
cys 

gca 
ala 

gtc 
val 

ctg 
leu 

gag 

glu 

tgg 



cag gtg 
gin val 

tct gcg 
ser ala 

gag gtg 
glu val 

gat gcg 
asp ala 

ctt get 
leu ala 

ctg gec 
leu ala 

ccc teg 
pro s e i 



gtc gtc 
val val 

gtg cgc 
val arg 

ttg teg 
leu ser 

gca ctg 
ala leu 

gga gcg 
gly ala 

gaa acg 
glu thr 

get cac 
ala his 



gac gcg 
asp ala 

gcg egg 
ala arg 

gcg ctg 
ala leu 

gag gag 
glu glu 

tgg teg 
trp ser 

gca ggt 
ala gly 

gec ate 
ala ile 



SEQ ID N° 40F 
FEUILLE DE REMg^|ME^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



130/185 



1/1 31/11 



CCT GGC 


CGG 


GAC 


GCC 


TAC 


GTG 


TAG 


CCC 


GCG 


GCT AGC 


ACA 


GGA 


TAG 


CCA 


TTG 


TTG 


TGC 


GGT 


pro gly 


arg 


asp 


ala 


ty r 


val 


AMB 


pro 


ala 


ala ser 


thr 


gly AMB 


pro 


leu 


leu 


cys 


gly 


61/21 


















91/31 












AGC GCC 


AAA 


ACG 


ATC 


AGC 


CCT 


TCG 


CGG 


ACA 


TGT CAG 


CAC 


CCG 


CCT 


TGG 


CCG 


GGA 


GAG 


CGG 


ser ala 


lys 


thr 


ile 


ser 


pro 


ser 


arg 


thr 


cys gin 


his 


pro 


pro 


trp 


pro 


gly 


glu 


arg 


121/41 


















151/51 










CGT CGT 


GAC 


CGT 


GCT 


GTC 


ACC 


ACG 


TCT 


GGT 


TAG GCT 


CGG 


GGC 


GCG 


GGC 


TGG 


CGC 


GGA 


GGA 


arg arg 


asp 


arg 


ala 


val 


thr 


thr 


ser 


gly 


AMB ala 


arg 


gly 


ala 


gly 


trp 


arg 


gly 


gly 


181/61 


















211/71 












GGT GTG 


TTG 


CGG 


AGG 


AGG 


TGT 


GTT 


GTA 


GTG 


GGG ACG 


GCG 


GAT 


CGG 


CCG 


TTG 


GAC 


GCC 


TCG 


gly val 


leu 


arg 


arg 


arg 


cys 


val 


val 


val 


gly thr 


ala 


asp 


arg 


pro 


leu 


asp 


ala 


ser 


241/81 


















271/91 












GCC TTG 


CGG 


GAC 


TGG 


GCA 


CAC 


GCC 


GTC 


GTC 


AGC GAT 


C 
















ala leu 


arg 


asp 


trp 


ala 


his 


ala 


val 


val 


ser asp 
































SEQ ID 


N° 41A 






























FIGURE 41A 


















1/1 


















31/11 


















CTG GCC 


GGG 


ACG 


CCT 


ACG 


TGT 


AGC 


CCG 


CGG 


CTA GCA 


CAG 


GAT 


AGC 


CAT 


TGT 


TGT 


GCG 




leu ala 


gly 


thr 


pro 


thr 


cys 


ser 


pro 


arg 


leu ala 


gin 


asp 


ser 


his 


cys 


cys 


ala 


val 


61/21 


















91/31 














GCG CCA 


AAA 


CGA 


TCA 


GCC 


CTT 


CGC 


GGA 


CAT 


GTC AGC 


ACC 


CGC 


CTT 


GGC 


CGG 


GAG 


AGC 


GGC 


ala pro 


lys 


arg 


ser 


ala 


leu 


arg 


gly 


his 


val ser 


thr 


arg 


leu 


gly 


arg 


glu 


ser 


gly 


121/41 


















151/51 










GTC GTG 


ACC 


GTG 


CTG 


TCA 


CCA 


CGT 


CTG 


GTT 


AGG CTC 


GGG 


GCG 


CGG 


GCT 


GGC 


GCG 


GAG 


GAG 


val val 


thr 


val 


leu 


ser 


pro 


arg 


leu 


val 


arg leu 


gly 


ala 


arg 


ala 


gly 


ala 


glu 


glu 


181/61 


















211/71 












GTG TGT 


TGC 


GGA 


GGA 


GGT 


GTG 


TTG 


TAG 


TGG 


GGA CGG 


CGG 


ATC 


GGC 


CGT 


TGG 


ACG 


CCT 


CGG 


val cys 


cys 


gly 


gly 


gly 


val 


leu 


AMB 


trp 


gly arg 


a rg 


lie 


gly 


arg 


trp 


thr 


pro 


arg 


241/81 


















271/91 
















CCT TGC 


GGG 


ACT 


GGG 


CAC 


ACG 


CCG 


TCG 


TCA 


GCG ATC 


















pro cys 


gly 


thr 


gly 


his 


thr 


pro 


ser 


ser 


ala ile 



















SEQ ID N° 41B 
FIGURE 4 IB 



FEUILLE DE REMPLACEWIENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



131/185 



1/1 31/11 

TGG CCG GGA CGC CTA CGT GTA GCC CGC GGC TAG CAC AGG ATA GCC ATT GTT GTG CGG TAG 
trp pro gly arg leu arg val ala arg gly AMB his arg ile ala ile val val arg AMB 
61/21 91/31 

CGC CAA AAC GAT CAG CCC TTC GCG GAC ATG TCA GCA CCC GCC TTG GCC GGG AGA GCG GCG 
arg gin asn asp gin pro phe ala asp met ser ala pro ala leu ala gly arg ala ala 
121/41 151/51 

TCG TGA CCG TGC TGT CAC CAC GTC TGG TTA GGC TCG GGG CGC GGG CTG GCG CGG AGG AGG 
ser OPA pro cys cys his his val trp leu gly ser gly arg gly leu ala arq arq arq 
181/61 211/71 

TGT GTT GCG GAG GAG GTG TGT TGT AGT GGG GAC GGC GGA TCG GCC GTT GGA CGC CTC GGC 
cys val ala glu glu val cys cys ser gly asp gly gly ser ala val gly arg leu gly 
241/81 271/91 
CTT GCG GGA CTG GGC ACA CGC CGT CGT CAG CGA TC 
leu ala gly leu gly thr arg arg arg gin arg 



SEQ ID N° 41C 
FIGURE 41C 



Sequence codante Rv2975c predite par Cole et al, 
contenant seq41A 

1/1 

gtg ggg 
val gly 
61/21 
gtc age 
val ser 
121/41 
gac tec 
asp ser 
181/61 
ttg cac 
leu his 
241/81 

gec ggc gcg cgt tga 
ala gly ala arg OPA 



1998 (Nature 393: 537-544) et 



gtc 



















31/11 














acg 


gcg 


gat 


egg 


ccg 


ttg 


gac 


gec 


teg gec 


ttg 


egg 


gac 


tgg 


gca 


cac 


thr 


ala 


asp 


arg 


pro 


leu 


asp 


ala 


ser ala 
91/31 


leu 


arg 


asp 


trp 


ala 


his 


gat 


ctg 


ate 


etc 


cac 


ate 


gac 


gag 


ate aac 


egg 


etc 


aat 


gtg 


ttc 


ccg 


asp 


leu 


ile 


leu 


his 


ile 


asp 


glu 


ile asn 


arg 


leu 


asn 


vai 


phe 


pro 


















151/51 












gat 


acc 


ggc 


gtc 


aac 


atg 


ctg 


ttc 


acc atg 


cgt 


gec 


gcg 


gtc 


gta 


gaa 


asp 


thr 


gly 


val 


asn 


met 


leu 


phe 


thr met 


arg 


ala 


ala 


val 


val 


glu 


















211/71 












gcg 


aat 


teg 


cag 


get 


gac 


gec 


gaa 


gac gtg 


gcg 


egg 


gtt 


gcg 


gec 


get 


ala 


asn 


ser 


gin 


ala 


asp 


ala 


glu 


asp val 


ala 


arg 


val 


ala 


ala 


ala 



val ala 



SEQ ID N° 41D 
FIGURE 4 ID 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



132/185 



ORF d'apres Cole et al, 1998 (Nature 393: 537-544) et contenant Rv2975c 
1/1 31/11 

tag get egg ggc gcg ggc tgg cgc gga gga ggt gtg ttg egg agg agg tgt gtt gta gtg 

AMB ala arg gly ala gly trp arg gly gly gly val leu arg arg arg cys val val val 
61/21 91/31 

ggg acg gcg gat egg ccg ttg gac gee teg gee ttg egg gac tgg gca cac gee gtc gtc 

gly thr ala asp arg pro leu asp ala ser ala leu arg asp trp ala his ala val val 
121/41 151/51 

age gat ctg ate etc cac ate gac gag ate aac egg etc aat gtg ttc ccg gtc get gac 

ser asp leu ile leu his ile asp glu ile asn arg leu asn val phe pro val ala asp 
181/61 211/71 

tec gat acc ggc gtc aac atg ctg ttc acc atg cgt gee gcg gtc gta gaa get gat ttg 

ser asp thr gly val asn met leu phe thr met arg ala ala val val glu ala asp leu 
241/81 271/91 

cac gcg aat teg cag get gac gee gaa gac gtg gcg egg gtt gcg gee get etc gcg gee 

his ala asn ser gin ala asp ala glu asp val ala arg val ala ala ala leu ala ala 
301/101 

ggc gcg cgt tga 

gly ala arg OPA 

SEQ ID N° 41F 
FIGURE 4 IF 



sequence Rv 2974C predite par Cole et'al. (Nature 393:537-544) et pouvant etre 
dans la meme phase de lecture que Seq41D. Le sequencage de cette region fait 
apparaitre dans un cas sur trois une deletion de deux nucleotides mettant en 
phase bserve. dans 



1/1 

ttg aac 
leu asn 
61/21 
gag gtg 
glu val 
121/41 
gee etc 
ala leu 
131/61 
gag gtg 
glu val 
241/81 
gcg cac 
ala his 
301/101 
gaa aag 
glu ivs 



gga get 
gly ala 

acc gcg 
thr ala 

ggg gee 
gly ala 

ccg gga 
pro gly 

gag ggg 
glu gly 



acc 
thi 



ccc 
oro 



cgc ggc 
arg gly 

act gcg 
thr ala 

gcg ttg 
ala leu 

act ate 
thr ile 

ttg gee 
leu ala 

gaa cag 
glu gin 



aac 
asn 

gec 
ala 

tgg 
trp 

gtc 
val 

ggt 
gly 

ctt 
leu 



tec ggc gtg 
ser gly val 

gec gec tct 
ala ala ser 

cgc ggc gtc 
arg gly val 

teg gtg ctg 
ser val leu 

gcg gtc acc 
ala val thr 

gac gtg etc 
asp val leu 



31/11 
ate ctg 
ile leu 
91/31 
ggc gcg 
gly ala 
151/51 
gag ttg 
glu leu 
211/71 
egg gee 
arg ala 
271/91 
gee gee 
ala ala 
331/111 
gec gat 
ala asp 



tec cag 
ser gin 

gta ttg 
val leu 

gtc gtc 
val val 

gee gec 
ala ala 

ggt gac 
gly asp 

gcg ggc 
ala gly 



ate ctg 
ile leu 

egg gcg 
arg ala 

gcg teg 
ala ser 

gga gec 
gly ala 

gcg gcg 
ala ala 

gcg gtg 
ala val 



cgc ggg 
arg gly 

gtc gac 
val asp 

atg ggt 
met gly 

gtc gac 
val asp 

gtc ate 
val ile 

gac qcc 
aso ala 



ate gca 
ile ala 

gec aac 
ala asn 

ggc gtg 
gly val 

cag tgc 
gin cys 

gcg ctg 
ala leu 

ggc gga 
gly gly 



SEQ ID N° 41S 



FIGURE 41S 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



361/121 

egg ggc ctg ctg gtt ctg ctg gac gcg 
arg gly leu leu val leu leu asp ala 
421/141 

egg gcg gtc tac gaa ccc teg ccg cgc 
arg ala val tyr glu pro ser pro arg 
481/161 

gec ccg caa ttc gag gtg atg tat ctg 
ala pro gin phe glu val met tyr leu 
541/181 

ttg egg gat cga etc aag gaa ttg ggt 
leu arg asp arg leu lys glu leu gly 
601/201 

age tac tec gta cac gtc cac acc gac 
ser tyr ser val his val his thr asp 
661/221 

gtg ggg cga gtt age egg ate gtg ate 
val gly arg val ser arg ile val ile 
721/241 

gee ggt ggc tgg acg egg ggc cgc gee 
ala gly gly trp thr arg gly arg ala 
781/261 

gag ctg ttc gec ggg gag ggc gec tgc 
glu leu phe ala gly glu gly ala cys 
841/281 

gec gec gat ate agt gec cac cag ctg 
ala ala asp ile ser ala his gin leu 
901/301 

gtg atg gtg ctg ccc aat ggc tat gtg 
val met val leu pro asn gly tyr val 
961/321 

gcg ate ggc tgg ggc gtc gac gtg gta 
ala ile gly trp gly val asp val val 
1021/341 

gec gcg ctg gec gtg cat gac gcg gee 
ala ala leu ala val his asp ala ala 
1081/361 

cgt gee gec ggt get tec egg cac gga 
arg ala ala gly ala ser arg his gly 
1141/381 

tgg gee ggt acc tgc aag ccg ggc gac 
trp ala gly thr cys lys pro gly asp 
1201/401 

gtc gee gac gat gtc gee gcg gcg gec 
val ala asp asp val ala ala ala ala 
1261/421 

ggc gat ctg gtg acg gtg eta att ggc 
gly asp leu val thr val leu ile gly 
1321/441 

gaa egg cat gtg cac gac cac cat cca 
glu arg his val his asp his his pro 
1381/461 

cgc ggc gac ccg ctg ctg ate ggg gtc 
arg gly asp ala leu leu ile gly val 



133/185 



391/131 

ttg cgc tec acc ate tgc ggg cag gca cct gee 
leu arg ser thr ile cys gly gin ala pro ala 
451/151 

gcg ttg ccg acc gac acg get acc caa cgc ccc 
ala leu pro thr asp thr ala thr gin arg pro 
511/171 

ttg gcg gta tgt gat get gca gcg gcg gac cag 
leu ala val cys asp ala ala ala ala asp gin 
571/191 

gag teg gtg gec ate gee get get ccg ccc gac 
glu ser val ala ile ala ala ala pro pro asp 
631/211 

gac gec ggt gec gec gtg gaa gec gga ttg gcg 
asp ala gly ala ala val glu ala gly leu ala 
691/231 

teg gcg etc ggt tec ggg acc age gga ttg ccg 
ser ala leu gly ser gly thr ser glv leu Dro 

751/251 

gtg ctg gcg gtc gtc gac ggc gac ggt gee gec 
val leu ala val val asp gly asp gly ala ala 
811/271 

gtg ctg cga ccg ggt cca gac gee gtg aca ccg 
val leu arg pro gly pro asp ala val thr pro 
871/291 

gtg egg gec gtg gta gac acc ggc gec gcg cac 
val arg ala val val asp thr gly ala ala his 

931/311 

gec gee gaa gaa ctg gtg gec ggg tgt acc gcg 
ala ala glu glu leu val ala gly cys thr ala 
991/331 

ccc gtg ccg acc gga teg atg gtg cag ggg ttg 
pro val pro thr gly ser met val gin gly leu 
1051/351 

cgc cag gec gtc gae gac ggc tac age atg gec 
arg gin ala val asp asp gly tyr ser met ala 
1111/371 

teg gtg cgc att gec acc caa aag gcg ctg acc 
ser val arg ile ala thr gin lys ala leu thr 
1171/391 

ggt ctg ggt ate gcg ggc gac gag gtg ctg ate 
gly leu gly ile ala gly asp glu val leu ile 
1231/411 

ate ggt ctg gtc gac ctg ttg ttg gca teg gga 
ile gly leu val asp leu leu leu ala ser gly 
1291/431 

gec ggc gta acc gaa gac gtg get gtc gtc ctg 
ala gly val thr giu asp val ala val val leu 
1351/451 

ggc acc gag ctg gtc tec tac cgc acc gga cac 
gly thr glu leu val ser tyr arg thr gly his 

14 11/471 
gag tag 
glu AM 3 
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Seq41T comprenant seq 41F et seq 415 

1/1 31/11 

tta ggc teg ggg cgc ggg ctg gcg egg agg agg tgt gtt gcg gag gag gtg tgt tgt agt 
leu gly ser gly arg gly leu ala arg arg arg cy 3 val ala glu glu val cys cys ser 
AMB ala arg gly ala gly trp arg gly gly gly val leu arg arg arg cys val val val 

arg leu gly ala arg ala gly ala glu glu val cys cys gly gly gly val leu AMB trp 
61/21 91/ 31 

ggg gac ggc gga teg gec gtt gga cgc etc ggc ctt gcg gga ctg ggc aca cgc cgt cgt 
gly asp gly gly ser ala val gly arg leu gly leu ala gly leu gly thr arg arg arg 
gly thr ala asp arg pro leu asp ala ser ala leu arg asp trp ala his ala val val 
gly arg arg ile gly arg trp thr pro arg pro cys gly thr gly his thr pro ser ser 
121/41 151/51 

cag cga tct gat cct cca cat cga cga gat caa ccg get caa tgt gtt ccc ggt cgc tga 
gin arg ser asp pro pro his arg arg asp gin pro ala gin cys val pro gly arg OPA 
ser asp leu ile leu his ile asp glu ile asn arg leu asn val phe pro val ala asp 
ala ile OPA ser ser thr ser thr arg ser thr gly ser met cys ser arg ser leu thr 
181/61 211/71 

etc cga tac egg cgt caa cat get gtt cac cat gcg tgc cgc ggt cgt aga age tga ttt 
leu arg tyr arg arg gin his ala val his his ala cys arg gly arg arg ser OPA phe 
ser asp thr gly val asn met leu phe thr met arg ala ala val val glu ala asp leu 
pro ile pro ala ser thr cys cys ser pro cys val pro arg ser AMB lys leu ile cys 
241/81 271/91 

gca cgc gaa ttc gca ggc tga cgc cga aga cgt ggc gcg ggt tgc ggc cgc tct cgc ggc 
ala arg glu phe ala gly OPA arg arg arg arg gly ala gly cys gly arg ser arg gly 
his ala asn ser gin ala asp ala glu asp val ala arg val ala ala ala leu ala ala 
thr arg ile arg arg leu thr pro lys thr trp arg gly leu arg pro leu ser arg pro 
301/101 331/111 

egg cgc gcg ttg aac gga get cgc ggc aac tec ggc gtg ate ctg tec cag ate ctg cgc 
arg arg ala leu asn gly ala arg gly asn ser gly val ile leu ser gin ile leu arg 

gly ala arg OPA thr glu leu ala ala thr pro ala OPA ser cys pro arg ser cys ala 
ala arg val glu arg ser ser arg gin leu arg arg aso pro val pro asp pro ala arq 
361/121 391/131 y 

ggg ate gca gag gtg ace gcg act gcg gec gec gec tct ggc gcg gta ttg egg gcg gtc 
gly lie ala glu val thr ala thr ala ala ala ala ser gly ala val leu arg ala val 

gly ser gin arg OPA pro arg leu arg pro pro pro leu ala arg tyr cys gly arg ser 

42i/i4i rg arg gly asp arg a3p cys gly arg arg leu tr? arg gly lle ala ar s 

gac gec aac gec etc ggg gec gcg ttg tgg cgc ggc gtc gag ttg gtc gtc gcg teg atg 
asp ala asn ala leu gly ala ala leu trp arg gly val glu leu val val ala ser met 
thr pro thr pro ser gly pro arg cys gly ala ala ser ser trp ser ser arg arg trp 

481/161 ln arg gly ar<? Val a3p 9ly 

ggt ggc gtg gag gtg ccg gga act ate gtc teg gtg ctg egg gee gec gee gga gee gtc 
gly gly val glu val pro gly thr ile val ser val leu arg ala ala ala gly ala val 
val ala trp arg cys arg glu leu ser ser arg cys cys gly pro pro pro glu pro ser 
trp arg gly gly ala gly asn tyr arg leu gly ala ala gly arg arg arg ser arg arq 
541/181 571/191 

gac cag tgc gcg cac gag ggg ttg gec ggt gcg gtc acc gee gee ggt gac gcg gcg gtc 
asp gin cys ala his glu gly leu ala gly ala val thr ala ala gly asp ala ala val 
thr ser ala arg thr arg gly trp pro val arg ser pro oro pro val thr arg arg ser 
pro val arg ala arg gly val gly arg cys gly his arg arg arg OPA arg gly gly h< s 
601/201 631/211 

ate gcg ctg gaa aag acc ccc gaa cag ctt gac gtg etc gec gat gcg ggc gcg gtg gac 
lie ala leu glu lys thr pro glu gin leu asp val leu ala asp ala gly ala val asp 
ser arg trp lys arg pro pro asn ser leu thr cys ser oro met arg ala arg trp thr 
arg ala gly lys asp pro arg thr ala OPA arg ala arq arg cys gly a-q gi v a : v a — 
661/221 691/231 " 

gec ggc gga egg ggc ctg ctg gtt ctg ctg gac gcg t— cgc tec acc ate tgc ggg cag 
ala gly gly arg gly leu leu val leu leu asp ala leu arg ser thr lie cys gly gin 
pro ala asp gly ala cys trp phe cys trp thr arg cvs ala oro oro ser ala gly arg 
arg arg thr gly pro ala gly ser ala gly arg val ala leu his his leu arg ala gly 
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721/241 751/251 

gca cct gcc egg gcg gtc tac gaa ccc teg ccg cgc gcg ttg ccg acc gac acg get acc 
ala pro ala arg ala val tyr glu pro ser pro arg ala leu pro thr asp thr ala thr 
his leu pro gly arg ser thr asn pro arg arg ala arg cys arg pro thr arg leu pro 
thr cys pro gly gly leu arg thr leu ala ala arg val ala asp arg his gly tyr pro 
781/261 811/271 

caa cgc ccc gcc ccg caa ttc gag gtg atg tat ctg ttg gcg gta tgt gat get gca gcg 
gin arg pro ala pro gin phe glu val met tyr leu leu ala val cys asp ala ala ala 
asn ala pro pro arg asn ser arg OPA cys ile cys trp arg tyr val met leu gin arg 
thr pro arg pro ala ile arg gly a3p val ser val gly gly met OPA cys cys 3er gly 
841/281 871/291 

gcg gac cag ttg egg gat cga etc aag gaa ttg ggt gag teg gtg gcc ate gcc get get 
ala asp gin leu arg asp arg leu lys glu leu gly glu ser val ala ile ala ala ala 
arg thr ser cys gly ile asp ser arg asn trp val ser arg trp pro ser pro leu leu 
gly pro val ala gly ser thr gin gly ile gly OPA val gly gly his arg arg cys ser 
901/301 931/311 

ccg ccc gac age tac tec gta cac gtc cac acc gac gac gcc ggt gcc gcc gtg gaa gcc 
pro pro asp ser tyr ser val his val his thr asp asp ala gly ala ala val glu ala 
arg pro thr ala thr pro tyr thr ser thr pro thr thr pro val pro pro trp lys pro 
ala arg gin leu leu arg thr arg pro his arg arg arg arg cys arg arg gly ser arg 
961/321 991/331 

gga ttg gcg gtg ggg cga gtt age egg ate gtg ate teg gcg etc ggt tec ggg acc age 
gly leu ala val gly arg val ser arg ile val ile ser ala leu gly ser gly thr ser 
asp trp arg trp gly glu leu ala gly ser OPA ser arg arg ser val pro gly pro ala 
ile gly gly gly ala ser AMB pro asp arg asp leu gly ala arg phe arg asp gin arg 
1021/341 1051/351 

gga ttg ccg gcc ggt ggc tgg acg egg ggc cgc gcc gtg ctg gcg gtc gtc gac ggc gac 
gly leu pro ala gly gly trp thr arg gly arg ala val leu ala val val asp gly asp 
asp cys arg pro val ala gly arg gly ala ala pro cys trp arg ser ser thr ala thr 
ile ala gly arg trp leu asp ala gly pro arg arg ala gly gly arg arg arg arg arg 
1081/361 1111/371 

ggt gcc gcc gag ctg ttc gcc ggg gag ggc gcc tgc gtg ctg cga ccg ggt cca gac gcc 
gly ala ala glu leu phe ala gly glu gly aid cys val leu arg pro gly pro asp ala 
val pro pro ser cys ser pro gly arg ala pro ala cys cys asp arg val gin thr pro 

cys arg arg ala val arg arg gly gly arg leu arg ala ala thr gly ser arg arg arg 
1141/381 1171/391 

gtg aca ccg gcc gcc gat ate agt gcc cac cag ctg gtg egg gcc gtg gta gac acc ggc 
val thr pro ala ala a3p ile ser ala his gin leu val arg ala val val asp thr gly 
OPA his arg pro pro ile ser val pro thr ser trp cys gly pro trp AMB thr pro ala 
asp thr gly arg arg tyr gin cys pro pro ala gly ala gly arg gly arg his arg arg 
1201/401 1231/411 

gcc gcg cac gtg atg gtg ctg ccc aat ggc tat gtg gcc gcc gaa gaa ctg gtg gcc ggg 
ala ala his val met val leu pro asn gly tyr val ala ala glu glu leu val ala gly 
pro arg thr OPA trp cys cys pro met ala met trp pro pro lys asn trp trp pro gly 
arg ala arg asp gly ala ala gin trp leu cys gly arg arg arg thr gly gly arq val 
1261/421 1291/431 

tgt acc gcg gcg ate ggc tgg ggc gtc gac gtg gta ccc gtg ccg acc gga teg atg gtg 
cys thr ala ala ile gly trp gly val asp val val pro val pro thr gly ser met vai 
val pro arg arg ser ala gly ala ser thr trp tyr pro cys arg pro asp arg trp cys 
tyr arg gly asp arg leu gly arg arg arg gly thr arg ala asp arg ile asp gly ala 
1321/441 1351/451 

cag ggg ttg gcc gcg ctg gcc gtg cat gac gcg gcc cgc cag gcc gtc gac gac ggc tac 
gin gly leu ala ala leu ala val his asp ala ala arg gin ala val asp asp gly tyr 
arg gly trp pro arg trp pro cys met thr arg pro ala arg pro ser thr thr ala thr 
gly val gly arg ala gly arg ala OPA arg gly pro pro gly arg arg arg arg leu gin 
1331/461 1411/471 

age atg gcc cgt gcc gcc ggt get tec egg cac gga teg gtg cgc att gcc acc caa aag 
ser met ala arg ala ala gly ala ser arg his gly ser val arg lie ala thr gin lys 
ala trp pro val pro pro val leu pro gly thr asp arg cys ala leu pro pro lys arg 
his gly pro cys arg arg cys phe pro ala arg ile gly ala his cys his pro lys gly 
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1441/481 1471/491 

gcg ctg acc tgg gcc ggt acc tgc aag ccg ggc gac ggt ctg ggt ate gcg ggc gac gag 
ala leu thr trp ala gly thr cys lys pro gly asp gly leu gly lie ala gly asp glu 
arg OPA pro gly pro val pro ala ser arg ala thr val trp val ser arg ala thr arg 
ala asp leu gly arg tyr leu gin ala gly arg arg ser gly tyr arg gly arg arg gly 
1501/501 1531/511 

gtg ctg ate gtc gcc gac gat gtc gcc gcg gcg gcc ate ggt ctg gtc gac ctg ttg ttg 
val leu ile val ala asp asp val ala ala ala ala lie gly leu val asp leu leu leu 
cys OPA ser ser pro thr met ser pro arg arg pro ser val trp ser thr cys cys trp 
ala asp arg arg arg arg cys arg arg gly gly his arg ser gly arg pro val val gly 
1561/521 1591/531 

gca teg gga ggc gat ctg gtg acg gtg eta att ggc gcc ggc gta acc gaa gac gtg get 
ala ser gly gly asp leu val thr val leu ile gly ala gly val thr glu asp val ala 
his arg glu ala ile trp OPA arg cys OCH leu ala pro ala OCH pro lys thr trp leu 
ile gly arg arg ser gly asp gly ala asn trp arg arg arg asn arg arg arg gly cys 
1621/541 1651/551 

gtc gtc ctg gaa egg cat gtg cac gac cac cat cca ggc acc gag ctg gtc tec tac cgc 
val val leu glu arg his val his asp his his pro gly thr glu leu val ser tyr arg 
ser ser trp asn gly met cys thr thr thr ile gin ala pro ser trp ser pro thr ala 
arg pro gly thr ala cys ala arg pro pro ser arg his arg ala gly leu leu pro h^ s 
1681/561 1711/571 
acc gga cac cgc ggc gac gcg ctg ctg ate ggg gtc gag tag 
thr gly his arg gly asp ala leu leu ile gly val glu AMB 
pro asp thr ala ala thr arg cys OPA ser gly ser ser 
arg thr pro arg arg arg ala ala asp arg gly arg val 
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1/1 


















31/11 


















GCC GGT 


AAC 


GCC 


GCG 


TCC 


CAG 


TGC 


TAT 


CCG 


TCC GCC 


GGA 


CCG 


CCC 


GAA 


ACA 


TCA 


GCG 


GCG 


ala gly 


asn 


ala 


ala 


ser 


gin 


cys 


tyr 


pro 


ser ala 


gly 


pro 


pro 


glu 


thr 


ser 


ala 


ala 


61/21 


















91/31 














GGC GCC 


CCG 


GTC 


GGC 


CGC 


GGC 


CGG 


GCT 


CGA 


CCC GCT 


CCA 


CCT 


GGC 


CAT 


CAG 


CGA 


CCA 


GGT 


gly ala 


pro 


val 


gly 


arg gly 


arg 


ala 


arg 


pro ala 


pro 


pro 


gly 


his 


gin 


arg 


pro 


gly 


121/41 


















151/51 












TAT CGA 


GGT 


GGA 


AGC 


GGA 


CGG 


TGT 


TGG 


GAT 


GCA CGC 


CCA 


ACT 


TGC 


CGG 


CGA 


TCG 


CGG 


CGA 


tyr arg 


gly 


gly 


ser 


gly 


arg 


cys 


trp 


asp 


ala arg 


pro 


thr 


cys 


arg 


arg 


ser 


arg 


arg 


181/61 


















211/71 










TGC TCA 


TCG 


GAA 


ccc 


GCG 


ACG 


CAC 


ACA 


ATG 


CCC GCA 


GCA 


CCG 


CAC 


GAC 


GGC 


GCC 


CCA 


CCG 


cys ser 


ser 


glu 


pro 


ala 


thr 


his 


thr 


met 


pro ala 


ala 


pro 


his 


asp 


gly 


ala 


pro 


pro 


241/81 


















271/91 












GCT CTT 


GCA 


GTG 


ACC 


TGA 


TGA 


TGA 


CAC 


TCA 


CCC CCA 


TAA 


GGC 


TCG 


TCG 


GCT 


GCG 


CCT 


GAG 


ala leu 


ala 


val 


thr 


OPA 


OPA 


OPA 


his 


ser 


pro pro 


OCH 


gly 


ser 


ser 


ala 


ala 


pro 


glu 


301/101 


















331/111 
















CAA TGC 


AGT 


AAG 


TTT 


ACA 


CAA 


ACG 


GAC 


TTG 


TAA AAA 


CCT 


GCG 


3AG 


GTG 


GGG 


TCT 


ATG 


GCC 


gin cys 


ser 


lys 


phe 


thr 


gin 


thr 


asp 


leu 


OCH lys 


pro 


ala 




val 


gly 


ser 


met 


ala 


361/121 


















391/131 














AAC AAA 


CGT 


GGC 


AAT 


GCC 


GGG 


CAG 


CCT 


CTG 


CCC TTG 


TCG 


GAT 














asn lys 


arg 


gly 


asn 


ala 


gly 


gin 


pro 


leu 


pro leu 


ser 


asp 
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1 



1/1 31/11 



CCG GTA 


ACG 


CCG 


CGT 


CCC 


AGT 


GCT 


ATC 


CGT 


CCG CCG 


GAC 


CGC 


CCG 


AAA 


CAT 


CAG 


CGG 


CGG 


pro val 


thr 


pro 


arg 


pro 


ser 


ala 


ile 


arg 


pro pro 


asp 


arq 


pro 


lvs 


his 


gin 


arg 


arg 


61/21 


















91/31 












GCG CCC 


CGG 


TCG 


GCC 


GCG 


GCC 


GGG 


CTC 


GAC 


CCG CTC 


CAC 


CTG 


GCC 


ATC 


AGC 


GAC 


CAG 


GTT 


ala pro 


arg 


ser 


ala 


ala 


ala 


gly 


leu 


asp 


pro leu 


his 


leu 


ala 


ile 


ser 


asp 


gin 


va 1 


121/41 


















151/51 














ATC GAG 


GTG 


GAA 


GCG 


GAC 


GGT 


GTT 


GGG 


ATG 


CAC GCC 


CAA 


CTT 


GCC 


GGC 


GAT 


CGC 


GGC 


GAT 


ile glu 


val 


glu 


ala 


asp 


gly 


val 


gly 


met 


his ala 


gin 


leu 


ala 


gly 


asp 


arg 


gly 


asp 


181/61 


















211/71 








GCT CAT 


CGG 


AAC 


CCG 


CGA 


CGC 


ACA 


CAA 


TGC 


CCG CAG 


CAC 


CGC 


ACG 


ACG 


GCG 


CCC 


CAC 


CGG 


ala his 


arg 


asn 


pro 


arg 


arg 


thr 


gin 


cys 


pro gin 


his 


arg 


thr 


thr 


ala 


pro 


his 


arg 


241/81 


















271/91 
















CTC TTG 


CAG 


TGA 


CCT 


GAT 


GAT 


GAC 


ACT 


CAC 


CCC CAT 


AAG 


GCT 


CGT 


CGG 


CTG 


CGC 


CTG 


AGC 


leu leu 


gin 


OPA 


pro 


asp 


asp 


asp 


thr 


his 


pro his 


lys 


ala 


arg 


arg 


leu 


arg 


leu 


ser 


301/101 


















331/111 












AAT GCA 


GTA 


AGT 


TTA 


CAC 


AAA 


CGG 


ACT 


TGT 


AAA aa: 


CTG 


CGG 


AGG 


TGG 


GGT 


CTA 


TGG 


CCA 


asn ala 


val 


ser 


leu 


his 


lys 


arg 


thr 


cys 


lys asn 


leu 


arg 


arg 


trp 


gly 


leu 


trp 


pro 


361/121 


















391/131 










ACA AAC 


GTG 


GCA 


ATG 


CCG 


GGC 


AGC 


CTC 


TGC 


CCT TGT 


CGG 


ATT 














thr asn 


val 


ala 


rue t 


pro 


a 1 v 


ser 


leu 


cys 


pro cys 


arg 


lie 
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FIGURE 42B 


















1/1 


















31/11 


















CGG TAA 


CGC 


CGC 


GTC 


CCA 


GTG 


CTA 


TCC 


GTC 


CGC CGG 


ACC 


GCC 


CGA 


AAC 


ATC 


AGC 


GGC 


GGG 


arg OCH 


arg 


arg 


val 


pro 


val 


leu 


ser 


val 


arg arg 


thr 


ala 


arg 


asn 


ile 


ser 


a 1 v 
y x j 


a 1 v 

y y 


61/21 


















91/31 














CGC CCC 


GGT 


CGG 


CCG 


CGG 


CCG 


GGC 


TCG 


ACC 


CGC TCC 


ACC 


TGG 


CCA 


TCA 


GCG 


ACC 


AGG 


TTA 


arg pro 


gly 


arg 


pro 


arg 


pro 


gly 


ser 


thr 


arg ser 


thr 


t rp 


pro 


ser 


ala 


thr 




leu 


121/41 


















151/51 












TCG AGG 


TGG 


AAG 


CGG 


ACG 


GTG 


TTG 


GGA 


TGC 


ACG CCC 


AAC 


TTG 


CCG 


GCG 


ATC 


GCG 


GCG 


ATG 


ser arg 


trp 


lys 


arg 


thr 


val 


leu 


gly 


cys 


thr pro 


asn 


leu 


pro 


ala 


ile 


ala 


ala 


met 


181/61 


















211/71 














CTC ATC 


GGA 


ACC 


CGC 


GAC 


GCA 


CAC 


AAT 


GCC 


CGC AGC 


ACC 


GCA 


CGA 


CGG 


CGC 


CCC 


ACC 


GGC 


leu ile 


gly 


thr 


a rg 


asp 


ala 


his 


asn 


ala 


arg ser 


thr 


ala 


arg 


arg 


arg 


pro 


thr 


gly 


241/81 


















271/91 










TCT TGC 


AGT 


GAC 


CTG 


ATG 


ATG 


ACA 


CTC 


ACC 


CCC ATA 


AGG 


CTC 


GTC 


GGC 


TGC 


GCC 


TGA 


GCA 


ser cys 


ser 


asp 


leu 


met 


met 


thr 


leu 


thr 


pro lie 


arg 


leu 


val 


gly 


cys 


ala 


OPA 


ala 


301/101 


















331/111 














ATG CAG 


TAA 


GTT 


TAC 


ACA 


AAC 


GGA 


CTT 


GTA 


AAA AC: 


TGC 


GGA 


GGT 


GGG 


GTC 


TAT 


GGC 


CAA 


met gin 


OCH 


val 


tyr 


thr 


asn 


gly 


leu 


val 


lys thr 


cys 


gly 


gly 


gly 


va 1 


tyr 


gly 


gin 


361/121 


















391/131 














CAA ACG 


TGG 


CAA 


TGC 


CGG 


GCA 


GCC 




GCC 


CTT gt: 


GGA 


TC 














gin thr 


t rp 


gin 


cys 


a rg 


ala 


ala 


ser 


ala 


leu val 


gly 
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Sequence codante Rv2622 predite par Co 
contenant seq42A: 

1/1 

atg gcc aac aaa cgt ggc aat gcc ggg cag 
Met ala asn lys arg gly asn ala gly gin 
61/21 

cac atg cag ggg cac tgg ctg ctg gcc egg 
his met gin gly his trp leu leu ala arg 
121/41 

gtc gaa etc acc egg aca ctg ctg gcc cgc 
val glu leu thr arg thr leu leu ala arg 
181/61 

ctg gca ccg ggc ctg ggc cgc acc gca gcc 
leu ala pro gly leu gly arg thr ala ala 
241/81 

gtg ggg gcg gag age gat ccc aac gcg gcc 
val gly ala glu ser asp pro asn ala ala 
301/101 

ggc gac gtc egg gtc acc gac gcg gcc gat 
gly asp val arg val thr asp ala ala asp 
361/121 

gtc ate ggc gag gcg atg ctg acc atg caa 
val ile gly glu ala met leu thr met gin 
421/141 

gag gcg gcg egg gtg ctg agg ccg ggt ggc 
glu ala ala arg val leu arg pro gly gly 
481/161 

ccg gac gac gtc gca gag cag gtc cgc acc 
pro asp asp val ala glu gin val arg thr 
541/181 

aag gtc aat gcg cgt ccg ctg acc gtt gcg 
lys val asn ala arg pro leu thr val ala 
601/201 

ctg gtc gtc gaa cac gtt gtc acc get tec 
leu val val glu his val val thr ala ser 
661/221 

get gac gaa ggc etc ctg ggt gcg ctg egg 
ala asp glu gly leu leu gly ala leu arg 
721/241 

gcg cgt egg cga gtc ctg ttg atg cgc cac 
ala arg arg arg val leu leu met arg his 
781/261 

gcc gtc gcc att gtc gcg cac aaa ccg cac 
ala val ala ile val ala his lys pro his 



et al., 1998 (Nature 393:537-544) et 



31/11 

cct ctg ccc ttg teg gat cga gac gac gac 

pro leu pro leu ser asp arg asp asp asp 
91/31 

ctg ggc aag egg gtg ctg cgt ccc ggc ggc 

leu gly lys arg val leu arg pro gly gly 
151/51 

gcc gag gtg acc gac gcc gac gtg etc gag 

ala glu val thr asp ala asp val leu glu 
211/71 

gaa ate ttg gcc cgc aac ccg egg teg tac 

glu ile leu ala arg asn pro arg ser tyr 
271/91 

aac ctg gtc cga cac gtt etc gcc ggc cgc 

asn leu val arg his val leu ala gly arg 
331/111 

acc gga tta tec gac gcc age gcc gat gtc 

thr gly leu ser asp ala ser ala asp val 
391/131 

ggc aac gcg get aaa cac acg ate gtc gcc 

gly asn ala ala lys his thr ile val ala 
451/151 

cgc tac gcg att cac gaa eta gcg ctg gtg 

arg tyr ala ile his glu leu ala leu val 
511/171 

gac ctg egg cag teg ctg gcc cgc gcg etc 

asp leu arg gin ser leu ala arg ala leu 
571/191 

gaa tgg teg cac etc tta gcg ggc cat gga 

glu trp ser his leu leu ala gly his gly 
631/211 

atg gcg ttg tta caa ccg cga egg gtg ate 

met ala leu leu gin pro arg arg val ile 
691/231 

ttc gcc gga aac ctg etc ate cat cgt gcc 

phe ala gly asn leu leu ile his arg ala 
751/251 

aca ttc cgc agg cat cgt gaa cgc ttg aca 

thr phe arg arg his arg glu arg leu thr 
811/271 

gtc gat teg tga 

val asp ser OPA 



SEQ ID N° 42D 



FIGURE 42D 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



139/185 



ORF d'apres Cole et al . , 1998 (Nature 393:537-544) et contenant Rv2622 
1/1 31/11 

taa aaa cct gcg gag gtg ggg tct atg gcc aac aaa cgt ggc aat gcc ggg cag cct ctg 
OCH lys pro ala glu val gly ser met ala asn lys arg gly asn ala gly gin Dro leu 
61/21 91/31 

ccc ttg teg gat cga gac gac gac cac atg cag ggg cac tgg ctg ctg gcc egg ctg ggc 
pro leu ser asp arg asp asp asp his met gin gly his trp leu leu ala arg leu qly 
121/41 151/51 

aag egg gtg ctg cgt ccc ggc ggc gtc gaa etc acc egg aca ctg ctg gcc cgc gcc gag 
lys arg val leu arg pro gly gly val glu leu thr arg thr leu leu ala arg ala glu 
181/61 211/71 

gtg acc gac gcc gac gtg etc gag ctg gca ccg ggc ctg ggc cgc acc gca gcc gaa ate 
val thr asp ala asp val leu glu leu ala pro gly leu gly arg thr ala ala glu ile 
241/81 271/91 

ttg gcc cgc aac ccg egg teg tac gtg ggg gcg gag age gat ccc aac gcg gcc aac ctg 
leu ala arg asn pro arg ser tyr val gly ala glu ser asp pro asn ala ala asn leu 
301/101 331/111 

gtc cga cac gtt etc gcc ggc cgc ggc gac gtc egg gtc acc gac gcg gcc gat acc gga 
val arg his val leu ala gly arg gly asp val arg val thr asp ala ala asp thr qly 
361/121 391/131 

tta tec gac gcc age gcc gat gtc gtc ate ggc gag gcg atg ctg acc atg caa ggc aac 
leu ser asp ala ser ala asp val val ile gly glu ala met leu thr met gin gly asn 
421/141 451/151 

gcg get aaa cac acg ate gtc gcc gag gcg gcg egg gtg ctg agg ccg ggt ggc cgc tac 
ala ala lys his thr ile val ala glu ala ala arg val leu arg pro gly gly arg tyr 
481/161 511/171 

gcg att cac gaa eta gcg ctg gtg ccg gac gac gtc gca gag cag gtc cgc acc gac ctg 
ala ile his glu leu ala leu val pro asp asp val ala glu gin val arg thr asp leu 
541/181 571/191 

egg cag teg ctg gcc cgc gcg etc aag gtc aat gcg cgt ccg ctg acc gtt gcg gaa tgg 
arg gin ser leu ala arg ala leu lys val asn ala arg pro leu thr val ala glu trp 
601/201 631/211 

teg cac etc tta gcg ggc cat gga ctg gtc gtc gaa cac gtt gtc acc get tec atg gcg 
ser his leu leu ala gly his gly leu val val glu his val val thr ala ser met ala 
661/221 691/231 

ttg tta caa ccg cga egg gtg ate get gac gaa ggc etc ctg ggt gcg ctg egg ttc gcc 
leu leu gin pro arg arg val ile ala asp glu gly leu leu gly ala leu arg phe ala 
"721/241 751/251 

gga aac ctg etc ate cat cgt gcc gcg cgt egg cga gtc ctg ttg atg cgc cac aca ttc 
gly asn leu leu ile his arg ala ala arg arg arg val leu leu met arg his thr phe 
781/261 811/271 

cgc agg cat cgt gaa cgc ttg aca gcc gtc gcc att gtc gcg cac aaa ccg cac gtc gat 
arg arg his arg glu arg leu thr ala val ala ile val ala his lys Dro his val asp 
841/281 
teg tga 
ser OPA 



SEQ ID N° 42F 
FIGURE 42F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



140/185 



1/1 


















31/11 


















ate gcg 
ile ala 

Dl/il 


cgt 
arg 


gac 
asp 


ate 
ile 


gat 
asp 


gac 
asp 


cag 
gin 


ggt 
gly 


egg 
arg 


ctg tgt 
leu cys 
91/31 


ctg 
leu 


gac 
asp 


gtc 
val 


ggc ggt 
gly gly 


cga 
arg 


acg 
thr 


gta 
val 


gtt gtt 
val val 
121/41 


tea 
ser 


gcg 
ala 


ggc 
gly 


gac 
asp 


gtg 
val 


gtg 
val 


cat 
his 


ttg 
leu 


cgt taa 
arg OCH 
151/51 


etc 
leu 


gcg 
ala 


egg 
arg 


age 
ser 


tgg 
trp 


cgt 
arg 


ccc 
pro 


caa 
gin 


aag att 
lys ile 
181/61 


aag 
lys 


gtc 
val 


gcg 
ala 


ggc atg 
gly met 


age 
ser 


tat 
tyr 


ccg 
pro 


gag aat 
glu asn 
211/71 


gtc 
val 


ctg 
leu 


gee 
ala 


get 
ala 


ggc 
gly 


gag 
glu 


cag 
gin 


gtc 
val 


gtt ctg 
val leu 
241/81 


cac 
his 


cgc 
arg 


cat 
his 


ccg 
pro 


cac 
his 


tgg 
trp 


aat 
asn 


cgc 
arg 


tta ate 
leu ile 
271/91 


tgg 
trp 


ccc 
pro 


gtc 
val 


gtg 
val 


gtg 
val 


ctg 
leu 


gtc 
val 


ttg 
leu 


ctg acc 
leu thr 


ggg 

gly 


ttg 
leu 


gcg 
ala 


gcg 
ala 


ttc 
phe 


ggg 

gly 


tec 
ser 


gga 
gly 


ttc gtc 
phe val 


aac 
asn 


teg 
ser 


aca 
thr 


cct 
pro 


tgg 
trp 


cag 
gin 


cag 
gin 


ate 
ile 



SEQ ID N° 43A 
FIGURE 43A 



1/1 


















31/11 


















teg cgc 
ser arg 
61/21 


gtg 
val 


aca 
thr 


teg 
ser 


atg 
met 


acc 
thr 


agg 
arg 


gtc 
val 


ggc 
gly 


tgt gtc 
cys val 
91/31 


tgg 
trp 


acg 
thr 


teg 
ser 


gcg 
ala 


gtc 
val 


gaa 
glu 


egg 
arg 


tag 
AMB 


ttg ttt 
leu phe 
121/41 


cag 
gin 


.egg 
arg 


gcg 
ala 


acg 
thr 


tgg 
trp 


tgc 
cys 


att 
ile 


tgc 
cys 


gtt aac 
val asn 
151/51 


teg 
ser 


cgc 
arg 


gga 
gly 


get 
ala 


ggc 
gly 


gtc 
val 


ccc 
pro 


aaa 

lys 


aga tta 
arg leu 
181/61 


agg 
a rg 


teg 
ser 


egg 
arg 


gca 
ala 


tga 
OPA 


get 
ala 


ate 
ile 


egg 
arg 


aga atg 
arg met 
211/71 


tec 
ser 


tgg 
trp 


ccg 
pro 


ctg 
leu 


gcg 
ala 


age 
ser 


a gg 

arg 


teg 
ser 


ttc tgc 
phe cys 
241/81 


acc 
thr 


gee 
ala 


ate 
ile 


cgc 
arg 


act 
thr 


gga 
gly 


ate 
ile 


get 
ala 


taa tct 
OCH ser 
271/91 


ggc 
gly 


ccg 
pro 


teg 
ser 


tgg 
trp 


tgc 
cys 


trp 


ser 


tgc 
cys 


tga ccg 
OPA pro 


ggt 
gly 


tgg 
trp 


egg 
arg 


cgt 
arg 


teg 
ser 


ggt 
gly 


ccg 

pro 


gat 
asp 


teg tea 
ser ser 


act 
thr 


cga 
arg 


cac 
his 


ctt 
leu 


ggc 
gly 


age 
ser 


aga 
arg 


tc 



SEQ ID N° 43B 
FIGURE 43B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



141/185 



1/1 


















31/11 


















cgc gcg 
arg ala 
61/21 


tga 
OPA 


cat 
his 


cga 
arg 


tga 
OPA 


cca 
pro 


ggg 

gly 


teg 
ser 


get 
ala 


gtg tct 
val ser 
91/31 


gga 
gly 


cgt 
a rg 


egg 
ara 


egg 
a rg 


teg 
ser 


aac 
asn 


ggt 
gly 


agt 
ser 


tgt ttc 
cys phe 
121/41 


age 
ser 


ggg 

gly 


cga 
arg 


cgt 
arg 


ggt 
gly 


gca 
ala 


ttt 
phe 


gcg 
ala 


tta act 
leu thr 
151/51 


cgc 
arg 


gcg 
ala 


gag 
glu 


ctg 
leu 


gcg 
ala 


tec 
ser 


cca 
pro 


aaa 
lys 


gat taa 
asp OCH 
181/61 


ggt 
gly 


cgc 
arg 


ggg 

gly 


cat 
his 


gag 
glu 


eta 
leu 


tec 
ser 


gga 
gly 


gaa tgt 
glu cys 
211/71 


cct 
pro 


ggc 
gly 


cgc 
arg 


tgg 
trp 


cga 
arg 


gca 
ala 


ggt 
gly 


cgt 
arg 


tct gca 
ser ala 
241/81 


ccg 
pro 


cca 
pro 


tec 
ser 


gca 
ala 


ctg 
leu 


gaa 
glu 


teg 
ser 


ctt 
leu 


aat ctg 
asn leu 
271/91 


gec 
ala 


cgt 
arg 


cgt 
arg 


ggt 
gly 


get 
ala 


ggt 
gly 


ctt 
leu 


get 
ala 


gac egg 
asp arg 


gtt 
val 


ggc 
gly 


ggc 
gly 


gtt 
val 


egg 
arg 


gtc 
val 


egg 
arg 


att 
ile 


cgt caa 
arg gin 


etc 
leu 


gac 
asp 


ace 
thr 


ttg 
leu 


gca 
ala 


gca 
ala 


gat 
asp 


c 



SEQ ID N° 43C 
FIGURE 43C 



Sequence codante Rv3278c predite par Cole et al., 1998 (Nature 393:537-544) e t 
contenant seq43A: 

1/1 31/11 

atg age tat ccg gag aat gtc ctg gee get ggc gag cag gtc gtt ctg cac cgc cat ccg 
Met ser tyr pro glu asn val leu ala ala gly glu gin val val leu his arg his pro 
61/21 ■ 91/31 



cac tgg aat cgc tta ate tgg ccc gtc gtg gtg ctg gtc ttg ctg ace ggg ttg gcg gcg 

his trp asn arg leu ile trp pro val val val leu val leu leu thr gly leu ala ala 
121/41 151/51 

ttc ggg tec gga ttc gtc aac teg aca cct tgg cag cag ate get aag aac gtg att cac 

phe gly ser gly phe val asn ser thr pro trp gin gin ile ala lys asn val lie his 

lBl/61 o i 1 / *7 i 



121/41 151/51 

ttc ggg tec gga ttc gtc aac teg aca cct tgg ca< 

phe gly ser gly phe val asn ser thr pro tro gl: 

181/61 211/71 

gcg gtc ate tgg ggg ate tgg ttg gtg ate gtc ggc tgg etc acg ctg tgg cca ttc ctg 

ala val lie trp gly ile trp leu val ile val gly trp leu thr leu trp pro phe leu 

241/81 271/91 

age tgg ctg ace aca cat ttc gtg gtg acc aac egg egg gtg atg ttc egg cat ggt gtg 

ser trp leu thr thr his phe val val thr asn arg arg val met phe arg his gly va i 

301/101 331/111 ' 

ctg acc cgc age ggg ate gac ata ccg eta gca egg ate aac age gtg gag ttc egg gac 

leu thr arg ser gly ile asp ile pro leu ala arg ile asn ser val glu ohe arq asD 

361/121 391/131 

egg ate ttc gag egg att ttt cgc acc ggg acg ttg att ate gag tec gcg tea caa gat 

arg lie phe glu arg ile phe arg thr gly thr ieu ile lie glu ser ala se- qln aso 

421/141 451/151 

ccg etc gag ttc tac aac att ccg cgc ctg egg gag gtg cat gcg ttg ctg tat cac gag 

pro leu glu phe tyr asn ile pro arg leu arg glu val his ala leu leu tyr his alu 

481/161 511/171 ' 9 

gtt ttc gac acc ctg ggc tec gac gag teg ccc age tga 

val phe asp thr leu gly ser asp glu ser pro ser OPA 



SEQ ID N° 43D 



FIGURE 43D 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



142/185 



ORF d'apres Cole et al., 1998 (Nature 3 
1/1 

taa etc gcg egg age tgg cgt ccc caa aag 

OCH leu ala arg ser trp arg pro gin lys 
61/21 

aat gtc ctg gee get ggc gag cag gtc gtt 

asn val leu ala ala gly glu gin val val 
121/41 

ate tgg ccc gtc gtg gtg ctg gtc ttg ctg 

ile trp pro val val val leu val leu leu 
181/61 

gtc aac teg aca cct tgg cag cag ate get 

val asn ser thr pro trp gin gin ile ala 
241/81 

ate tgg ttg gtg ate gtc ggc tgg etc acg 

ile trp leu val ile val gly trp leu thr 
301/101 

cat ttc gtg gtg acc aac egg egg gtg atg 

his phe val val thr asn arg arg val met 
361/121 

ate gac ata ccg eta gca egg ate aac age 

ile asp ile pro leu ala arg ile asn ser 
421/141 

att ttt cgc acc ggg acg ttg att ate gag 

ile phe arg thr gly thr leu ile ile glu 
481/161 

aac att ccg cgc ctg egg gag gtg cat gcg 

asn ile pro arg leu arg glu val his ala 
541/181 

ggc tec gac gag teg ccc age tga 

gly ser asp glu ser pro ser OPA 



>3:537-544) et contenant Rv3278c 
31/11 

att aag gtc gcg ggc atg age tat ccg gag 

ile lys val ala gly met ser tyr pro glu 
91/31 

ctg cac cgc cat ccg cac tgg aat cgc tta 

leu his arg his pro his trp asn arg leu 
151/51 

acc ggg ttg gcg gcg ttc ggg tec gga ttc 

thr gly leu ala ala phe gly ser gly phe 
211/71 

aag aac gtg att cac gcg gtc ate tgg ggg 

lys asn val ile his ala val ile trp gly 
271/91 

ctg tgg cca ttc ctg age tgg ctg acc aca 

leu trp pro phe leu ser trp leu thr thr 
331/111 

ttc egg cat ggt gtg ctg acc cgc age ggg 

phe arg his gly val leu thr arg ser gly 
391/131 

gtg gag ttc egg gac egg ate ttc gag egg 

val glu phe arg asp arg ile phe glu arg 
451/151 

tec gcg tea caa gat ccg etc gag ttc tac 

ser ala ser gin asp pro leu glu phe tyr 
511/171 

ttg ctg tat cac gag gtt ttc gac acc ctg 

leu leu tyr his glu val phe asp thr leu 



SEQ ID N° 43F 
FIGURE 43F 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



POYFR98/01813 



143/185 



1/1 


















31/11 


















gcc aag 


atg 


gat 


gtc 


tac 


caa 


cgc 


acc 


gcc 


gcc ggc 


tgg 


cag 


ccg 


etc 


aag 


acc 


ggt 


ate 


ala lys met 


asp 


val 


tyr 


gin 


arg 


thr 


ala 


ala gly 


trp 


gin 


pro 


leu 


lys 


thr 


al v 


ile 


61/21 


















91/31 














acc acc 


cat 


ate 


ggt 


teg 


gcg 


ggc 


atg 


gcg 


ccg gaa 


gcc 


aag 


age 


gga 


tat 


ccg 


qcc 


act 


thr thr 


his 


ile 


gly 


ser 


ala 


gly met 


ala 


pro glu 


ala 


lys 


ser 


gly 


tyr 


pro 


ala 


thr 


121/41 


















151/51 












ccg atg 


ggg 


gtt 


tac 


age 


ctg 


gac 


tec 


get 


ttt ggc 


acc 


gcg 


ccg 


aat 


ccc 


gqt 


ggc 




pro met 


q1 v 


val 


tyr 


ser 


leu 


asp 


ser 


ala 


phe gly 


thr 


ala 


pro 


asn 


pro 


gl v 


q1 v 


al v 


181/61 














aat 




211/71 










ttg ccg 


tat 


acc 


caa 


gtc 


gga 


ccc 


cac 


tgg tgg 


agt 


ggc 


gac 


gac 


aat 


age 


ccc 


acc 


leu pro 


tyr 


thr 


gin 


val 


gly 


pro 


asn 


his 


trp trp 


ser 


gly 


asp 


asp 


asn 


ser 


pro 


thr 


241/81 


















271/91 














ttt aac 


tec 


atg 


cag 


gtc 


tgt 


cag 


aag 


tec 


cag tgc 


ccg 


ttc 


age 




gcc 


gac 


age 


gag 


phe asn 


ser 


met 


gin 


val 


cys 


gin 


lys 


ser 


gin cys 


pro 


phe 


ser 


thr 


ala 


asp 


ser 


glu 


301/101 


















331/111 














aac ctg 


caa 


ate 


ccg 


cag 


tac 


aag 


cat 


teg 


gtc gtg 


atg 


ggc 


gtc 


aac 


aag 


gcc 


aag 


gtc 


asn leu 


gin 


ile 


pro 


gin 


tyr 


lys 


his 


ser 


val val 


met 


gly 


val 


asn 


lys 


ala 


lys 


val 


361/121 


















391/131 












cca ggc 


aaa 


ggc 


tec 


gcg 


ttc 


ttc 


ttt 


cac 


acc acc 


gac 


ggc 


ggg 


ccc 


acc 


gcg 


ggt 


tgt 


pro gly 


lys 


gly 


ser 


ala 


phe 


phe 


phe 


his 


thr thr 


asp 


gly gly 


pro 


thr 


ala 


gly 


cys 


421/141 






























gtg gcg 


ate 


































val ala 


ile 



































SEQ ID N° 44A 
FIGURE 44A 



1/1 



cca aga 


tgg 


atg 


tct 


acc 


aac 


gca 


ccg 


ccg 


pro arg 


trp 


met 


ser 


thr 


asn 


ala 


pro 


pro 


61/21 
















cca ccc 


ata 


teg 


gtt 


egg 


egg 


gca 


tgg 


cgc 


pro pro 


ile 


ser 


val 


arg 


arg 


ala 


trp 


arg 


121/41 


















cga tgg 


ggg 


ttt 


aca 


gcc 


tgg 


act 


ccg 


ctt 


arg trp 


gly 


phe 


thr 


ala 


trp 


thr 


pro 


leu 


181/61 


















tgc cgt 


ata 


ccc 


aag 


teg 


gac 


cca 


ate 


act 


cys arg 


ile 


pro 


lys 


ser 


asp 


pro 


ile 


thr 


241/81 


















tta act 


cca 


tgc 


agg 


tct 


gtc 


aga 


agt 


ccc 


leu thr 


pro 


cys 


arg 


ser 


val 


arg 


ser 


pro 


301/101 


















acc tgc 


aaa 


tec 


cgc 


agt 


aca 


age 


att 


egg 


thr cys 


lys 


ser 


arg 


ser 


thr 


ser 


ile 


arg 


361/121 


















cag gca 


aag 


get 


ccg 


cgt 


tct 


tct 


ttc 


aca 


gin ala 


lys 


ala 


pro 


arg 


ser 


ser 


phe 


thr 



421/141 
tgg cga tc 
trp arg 



31/11 

ccg get ggc age cgc tea aga ccg gta tea 

pro ala gly ser arg ser arg pro val ser 
91/31 

egg aag cca aga gcg gat ate egg cca etc 

arg lys pro arg ala asp ile arg oro leu 
151/51 

ttg gca ccg cgc cga ate ccg gtg gcg ggt 

leu ala pro arg arg ile pro val ala gly 
211/71 

ggt gga gtg gcg acg aca ata gcc cca cct 

gly gly val ala thr thr ile ala oro pro 
271/91 

agt gcc cgt tea gca egg ccg aca gcg aga 

ser ala arg ser ala arg oro thr ala arg 
331/111 

teg tga tgg gcg tea aca agg cca agg tec 

ser OPA trp ala ser thr arg pro arg ser 
391/131 

cca ccg acg gcg ggc cca ccg egg gtt gtg 

pro pro thr ala gly pro pro arg val val 



SEQ ID N° 44B 
FEUILLE DE REMP^ggEI^J^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



144/185 



1/1 

caa gat gga tgt 
gin asp gly cys 
61/21 

cac cca tat egg 
his pro tyr arg 
121/41 

gat ggg ggt tta 
asp gly gly leu 
181/61 

gcc gta tac cca 
ala val tyr pro 
241/81 

taa etc cat gca 
OCH leu his ala 
301/101 

cct gca aat ccc 
pro ala asn pro 
361/121 

agg caa agg etc 
arg gin arg leu 
421/141 
ggc gat c 
gly asp 



eta cca acg cac 
leu pro thr his 

ttc ggc ggg cat 
phe gly gly his 

cag cct gga etc 
gin pro gly leu 

agt egg ace caa 
ser arg thr gin 

ggt ctg tea gaa 
gly leu ser glu 

gca gta caa gca 
ala val gin ala 

cgc gtt ctt ctt 
arg val leu leu 







31/11 


cgc 


cgc 


egg ctg 


arg 


arg 


arg leu 






91/31 


ggc 


gcc 


gga age 


gly 


ala 


gly ser 






151/51 


cgc 


ttt 


tgg cac 


arg 


phe 


trp his 






211/71 


tea 


ctg 


gtg gag 


ser 


leu 


val glu 






271/91 


gtc 


cca 


gtg ccc 


val 


pro 


val pro 






331/111 


ttc 


ggt 


cgt gat 


phe 


gly 


arg asp 






391/131 


tea 


cac 


cac cga 


ser 


his 


his arg 



SEQ ID N° 44C 
FIGURE 44C 



gca 
ala 


gcc 
ala 


get 
ala 


caa 
gin 


caa 
gin 


gag 
glu 


egg 
arg 


ata 
ile 


cac 
arg 


gcc 
ala 


gaa 
glu 


ser 


tgg 
trp 


cga 
arg 


cga 
arg 


caa 
gin 


gtt 
val 


cag 
gin 


cac 
his 


ggc 
gly 


ggg 

gly 


cgt 
a rg 


caa 
gin 


caa 
gin 


egg 
arg 


egg 
arg 


gcc 
ala 


cac 
his 



gac egg tat cac 
asp arg tyr his 

tec ggc cac tec 
ser gly his ser 

egg tgg egg gtt 
arg trp arg val 

tag ccc cac ctt 
AMB pro his leu 

cga cag cga gaa 
arg gin arg glu 

ggc caa ggt ccc 
gly gin gly pro 

cgc ggg ttg tgt 
arg gly leu cys 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



145/185 



Sequence codante Rv0309 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant Seq44A: 



1/1 

atg age cga etc eta get ttg ctg tgc get 
Met ser arg leu leu ala leu leu cys ala 
61/21 

etc gcg cca gtg age ctg gee gtc gtc aac 
leu ala pro val ser leu ala val val asn 
121/41 

act cag gtg gtt teg gtg gtg gga acc ggc 
thr gin val val ser val val gly thr gly 
181/61 

cgc acc gee gee ggc tgg cag ccg etc aag 
arg thr ala ala gly trp gin pro leu lys 
241/81 

ggc atg gcg ccg gaa gee aag age gga tat 
gly met ala pro glu ala lys ser gly tyr 
301/101 

gac tec get ttt ggc acc gcg ccg aat ccc 
asp ser ala phe gly thr ala pro asn oro 
361/121 

ccc aat cac tgg tgg agt ggc gac gac aat 
pro asn his trp trp ser gly asp asp asn 
421/141 

cag aag tec cag tgc ccg ttc age acg gec 
gin lys ser gin cys pro phe ser thr ala 
481/161 

aag cat teg gtc gtg atg ggc gtc aac aag 
lys his ser val val met gly val asn lys 
541/181 

ttc ttt cac acc acc gac ggc ggg ccc acc 
phe phe his thr thr asp gly gly pro thr 
601/201 

ctg gtg cag ate ate cgt tgg ctg egg cct 
leu val gin ile ile arg trp leu arg pro 



31/11 

gcg gta tgc acg ggc tgc gtt get gtg gtt 

ala val cys thr gly cys val ala val val 
91/31 

ccg tgg ttc gcg aac teg gtc ggc aat gec 

pro trp phe ala asn ser val gly asn ala 
151/51 

ggt teg acg gec aag atg gat gtc tac caa 

gly ser thr ala lys met asp val tyr gin 
211/71 

acc ggt ate acc acc cat ate ggt teg gcg 

thr gly ile thr thr his ile gly ser ala 
271/91 

ccg gee act ccg atg ggg gtt tac age ctg 

pro ala thr pro met gly val tyr ser leu 
331/111 

ggt ggc ggg ttg ccg tat acc caa gtc gga 

gly gly gly leu pro tyr thr gin val gly 
391/131 

age ccc acc ttt aac tec atg cag gtc tgt 

ser pro thr phe asn ser met gin val cys 
451/151 

gac age gag aac ctg caa ate ccg cag tac 

asp ser glu asn leu gin ile pro gin tyr 
511/171 

gec aag gtc cca ggc aaa ggc tec gcg ttc 

ala lys val pro gly lys gly ser ala one 
571/191 

gcg ggt tgt gtg gcg ate gac gat gee acg 

ala gly cys val ala ile asp aso ala thr 
631/211 

ggt gcg gtg ate gcg ate gec aag taa 

gly ala val ile ala ile ala lys OCH 



SEQ ID N° 44D 
FIGURE 44D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



146/185 



ORF d'apres Cole et al . , 1998 (Nature 393:537-544) et contenant Rv0309 



1/1 



tga gcg 


atg 


age 


cga 


etc 


OPA ala 


met 


ser 


arg 


leu 


61/21 










gtg gtt 


etc 


gcg 


cca 


gtg 


val val 


leu 


ala 


pro 


val 


121/41 








aat gcc 


act 


cag 


gtg 


gtt 


asn ala 


thr 


gin 


val 


val 


181/61 










tac caa 


cgc 


ace 


gcc 


gcc 


tyr gin 


arg 


thr 


ala 


ala 


241/81 










teg gcg 


ggc 


atg 


gcg 


ccg 


ser ala 


gly met 


ala 


pro 


301/101 










age ctg 


gac 


tec 


get 


ttt 


ser leu 


asp 


ser 


ala 


phe 


361/121 










gtc gga 


ccc 


aat 


cac 


tgg 


val gly pro 


asn 


his 


trp 


421/141 








gtc tgt 


cag 


aag 


tec 


cag 


val cys 


gin 


lys 


ser 


gin 


481/161 








cag tac 


aag 


cat 


teg 


gtc 


gin tyr 


lys 


his 


ser 


val 


541/181 










gcg ttc 


ttc 


ttt 


cac 


acc 


ala phe 


phe 


phe 


his 


thr 


601/201 










gcc acg 


ctg 


gtg 


cag 


ate 


ala thr 


leu 


val 


gin 


ile 


661/221 








taa 










OCH 











31/11 

eta get ttg ctg tgc get gcg 

leu ala leu leu cys ala ala 
91/31 

age ctg gcc gtc gtc aac ccg 

ser leu ala val val asn pro 
151/51 

teg gtg gtg gga acc ggc ggt 

ser val val gly thr gly gly 
211/71 

ggc tgg cag ccg etc aag acc 

gly trp gin pro leu lys thr 
271/91 

gaa gcc aag age gga tat ccg 

glu ala lys ser gly tyr pro 

331/111 

ggc acc gcg ccg aat ccc ggt 

gly thr ala pro asn pro gly 
391/131 

tgg agt ggc gac gac aat age 

trp ser gly asp asp asn ser 
451/151 

tgc ccg ttc age acg gcc gac 

cys pro phe ser thr ala asp 
511/171 

gtg atg ggc gtc aac aag gcc 

val met gly val asn lys ala 
571/191 

acc gac ggc ggg ccc acc gcg 

thr asp gly gly pro thr ala 
631/211 

ate cgt tgg ctg egg cct ggt 

ile arg trp leu arg pro gly 



SEQ ID N° 44F 
FIGURE 44F 



gta tgc acg ggc tgc gtt get 

val cys thr gly cys val ala 

tgg ttc gcg aac teg gtc ggc 

trp phe ala asn ser val gly 

teg acg gcc aag atg gat gtc 

ser thr ala lys met asp val 

ggt ate acc acc cat ate ggt 

gly ile thr thr his ile gly 

gcc act ccg atg ggg gtt tac 

ala thr pro met gly val tyr 

ggc ggg ttg ccg tat acc caa 

gly gly leu pro tyr thr gin 

ccc acc ttt aac tec atg cag 

pro thr phe asn ser met gin 

age gag aac ctg caa ate ccg 

ser glu asn leu gin ile pro 

aag gtc cca ggc aaa ggc tec 

lys val pro gly lys gly ser 

ggt tgt gtg gcg ate gac gat 

gly cys val ala ile asp asp 

gcg gtg ate gcg ate gcc aag 

ala val ile ala ile ala lys 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PO7FR98/01813 



147/185 



Fragment clone en fusion avec phoA 
1/1 

gat etc ccc gga cac cag gtc ate egg cga 

asp leu pro gly his gin val ile arg arg 
61/21 

tec ggt age cag agg cac cag cat cag caa 

ser gly ser gin arg his gin his gin gin 
121/41 

ggt cct tgc cac teg cga tec ttg gga tga 

gly pro cys his ser arg ser leu gly OPA 
181/61 

ate gtg cca gac egg gca tgc cgc gtc ggc 

ile val pro asp arg ala cys arg val gly 
241/81 

gtg cga ccc agg atg gcg aat get egg ggg 

val arg pro arg met ala asn ala arg gly 
301/101 

teg gtg aag ccc aac egg egg tac aac cgc 

ser val lys pro asn arg arg tyr asn arg 
361/121 

ggt gtg gag age agg acg ttg tec teg teg 

gly val glu ser arg thr leu ser ser ser 
421/141 

tec ccg agg cca egg cct tga gcg egg gga 

ser pro arg pro arg pro OPA ala arg gly 
481/161 

ctg gtc ate agt egg gcg ate get agg cgc 

leu val ile ser arg ala ile ala arg arg 
541/181 

acc tgc tgt tgc cac cac tgg ccg ggc gec 

thr cys cys cys his his trp pro gly ala 
601/201 

ggc gcg ttg etc agt teg gcg gec gac ggc 

gly ala leu leu ser ser ala ala asp gly 
661/221 

teg get gec gtt acc teg acg gec gcg acc 

ser ala ala val thr ser thr ala ala thr 
721/241 

age cac att ggg gcg cgc aaa gtc teg gtg 

ser his ile gly ala arg lys val ser val 
781/261 

acc gtc agg gca tea ccg agg egg cgc tec 

thr val arg ala ser pro arg arg arg ser 
841/281 

ate gee aac gcg egg tgt cct cct cat gtg 

ile ala asn ala arg cys pro pro his val 
901/301 

egg aca age cga tga ggc cgc ccg cgc tgg 

arg thr ser arg OPA gly arg pro arg trp 



31/11 



gat ggt gat 
asp gly asp 
91/31 


cga 
arq 


ggc 
al v 


teg 
ser 


gac 
asp 


ccg 
pro 


cag 
gin 


gca 
ax a 


cat cgc 
his arg 
151/51 


gat 
asp 


ggc 
gly 


cag 
qln 


cat 
his 


gec 
ala 


gcg 
ala 


ccg 
pro 


teg 
ser 


egg tgg 
arg trp 
211/71 


ggc 
gly 


ata 
ile 


get 
ala 


age 
ser 


gcg 
ala 


cac 
his 


cag 
gin 


gtc 
val 


aag ctg 
lys leu 
271/91 


teg 
ser 


ggc 
cjl v 


gcg 
ala 


ggt 
civ 


tag 
AMB 


age 
ser 


ggt 
gly 


age 
ser 


tea ccg 
ser pro 
331/111 


gcg 
ala 


aag 
lys 


tgg 
trp 


tag 
AMB 


ccg 
pro 


egg 
a r g 


atg 
me t 


atg 
me t 


cac gee 
his ala 
391/131 


cga 
arg 


ttg 
leu 


tec 
ser 


tea 
ser 


ccg 
p ro 


ttg 
leu 


gtc 
val 


tec 
ser 


cga ccg 
arg pro 
451/151 


get 
ala 


age 
ser 


agt 
ser 


egg 
arg 


egg 
arc 


gec 
ala 


aac 
asn 


gec 
ala 


agg atg 
arg met 
511/171 


tgc 
cys 


aat 
asn 


tea 
ser 


gtc 
val 


aac 
asn 


teg 
ser 


aag 

1 vs 
j 


tag 
AMB 


gga aag 
gly lys 
571/191 


ccg 
pro 


ctg 
leu 


cgt 
are 


tgc 

CVS 


aag 


ccc 


agt 
ser 


acc 

+- U v- 


ccg gga tag 
pro gly AMB 
631/211 


ccg 
pro 


tac 
t vr 


gec 
ala 


act 
thr 


ccg 


age 
ser 


att 

11€ 


age gec 
ser ala 
691/231 


gtg 
val 


gtg 
val 


teg 
ser 


gcg 
ala 


gee 
ala 


teg 
ser 


gee 

dj_ct 


tgt 
cys 


gee tgc 
ala cys 
751/251 


cag 
gin 


ccg 
pro 


cgc 
arg 


cgc 
arg 


egg 
arg 


atg 
met 


tgc 
cys 


tec 
ser 


ccc ctg 
pro leu 
811/271 


ggg tag 
gly AMB 


cgc 
arg 


ate 
ile 


gcg 
ala 


teg 
ser 


aca 
thr 


tac 
tyr 


ata teg 
ile ser 
871/291 


ctg 
leu 


ggc 
gly 


ggc 
gly 


aga 
arg 


teg 
ser 


atg 
met 


agg 
arg 


aat 
asn 


atg aac 
me t asn 
931/311 


cga 
arg 


tgc 
cys 


gtg 
val 


ctt 
leu 


gcg 
ala 


cac 
his 


cag 
gin 


tat 
tyr 


acg ggg 
thr gly 


ctt 
leu 


gta 
val 


gcg 
ala 


tat 
tyr 


ggc 
gly 


cgt 
arg 


ttc 
phe 


cgc 
arg 



SEQ ID N° 45ZA 
FIGURE 45ZA 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



148/185 



961/321 
















991/331 
















tea get cgt 
ser ala arg 
1021/341 


cgc 
arg 


tgc 
cys 


ggc 
gly 


gee 
ala 


gec 
ala 


ggg 

gly 


ata 
ile 


gaa teg ccc 
glu ser pro 
1051/351 


gcg 
ala 


aac 
asn 


caa 
gin 


tea 
trp 


tac 
tyr 


aac 
gly 


gca 
ala 


gat tga cct 
asp OPA pro 
1081/361 


cgt 
arg 


ate 
ile 


ate 
ile 


tqa 
OPA 


gtt 
val 


agt 
ser 


tqc 
cys 


ccg cgc aat 
pro arg asn 
1111/371 


GGG 

gly 


cat 
his 


ccg 
pro 


eg t 
arg 


at f 
val 


ate 
ile 


rr rr t~ 

yy L 
gly 


att acg tga 
ile thr OPA 
1141/381 


cag 
gin 


tct 
ser 


gtc 
val 


ggc 
gly 


aag 
lys 


gag 
glu 


gly 


cgc atg cca 
arg met pro 
1171/391 


etc 
leu 


tec 
ser 


gat 
asp 


cat 
his 


n a n 

glu 


cag 
gin 


egg 
arg 


atg ctt gac 
met leu asp 
1201/401 


cag 
gin 


ate 
ile 


9 a g 

glu 


age 
ser 


get 
ala 


etc 
leu 


tac 
tyr 


gee gaa gat 
ala glu asp 
1231/411 


ccc 
pro 


aag 
lys 


ttc 
phe 


gca 
ala 


tea 
ser 


agt 
ser 


ate 
val 


cgt ggc ggg 
arg gly gly 
1261/421 


ggc 
gly 


ttc 
phe 


cgc 
arg 


gca 
ala 


ccg 
pro 


acc 
thr 


gcg 
ala 


egg egg cgc 
arg arg arg 
1291/431 


ctg 
leu 


caa 
gin 


aac 
gly 


GCG 

ala 


aca 
ala 


tta 
leu 


ttc 
phe 


ate ate ggt 
ile ile gly 
1321/441 


ctg 
leu 


ggg 

gly 


atg 
met 


ttg 
leu 


gtt 
val 


tec 
ser 


ggc 
gly 


gtg gcg ttc 
val ala phe 
1351/451* 


aaa 
lys 


gag 
glu 


acc 
thr 


atg 
met 


ate 

ile 


gga 
gly 


agt 
ser 


ttc ccg ata 
phe pro ile 
1381/461 


etc 
leu 


age 
ser 


gtt 
val 


ttc 
phe 


ggt ttt 
gly phe 


gtc 
val 


gtg atg ttc 
val met phe 
1411/471 


ggt 
gly 


ggt 
gly 


gtg 
val 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


acc ggt cct 
thr gly pro 
1441/481 


egg 
arg 


ttg 
leu 


tec 
ser 


ggc 
gly 


agg 
arg 


atg 
met 


gat 
asp 


cgt ggc gga 
arg gly gly 
1471/491 


teg 
ser 


get 
ala 


get 
ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


cag cgt cgt 
gin arg arg 


acc 
thr 


aag 
lys 


ggg 

gly 


gec 
ala 


ggg 

gly 


ggc 
gly 


tea 
ser 


ttc acc age 
phe thr ser 


cgt 
arg 


atg 
met 


gaa 
glu 


gat 
asp 


c 







SEQ ID N° 45ZA (suite) 
FIGURE 45ZA (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



149/185 



fragment seq4SZA en decalage moins 1 pour la phase de lecture 



1/1 

ate tec 
ile ser 
61/21 
ccg gta 
pro val 
121/41 
gtc ctt 
val leu 
181/61 
teg tgc 
ser cys 
241/81 
tgc gac 
cys asp 
301/101 
egg tga 
arg OPA 
361/121 
gtg tgg 
val trp 
421/141 
ccc cga 
pro arg 
481/161 
tgg tea 
trp ser 
541/181 
cct get 
pro ala 
601/201 
gcg cgt 
ala arg 
661/221 
egg ctg 
arg leu 
721/241 
gee aca 
ala thr 
781/261 
ccg tea 
pro ser 
841/281 
teg cca 
ser pro 
901/301 
gga caa 
gly gin 
961/321 
cag etc 
gin leu 



ccg gac ace agg tea tec ggc gag 
pro asp thr arg ser ser gly glu 

gee aga ggc acc age ate age aac 
ala arg gly thr ser ile ser asn 

gee act cgc gat cct tgg gat gac 
ala thr arg asp pro trp asp asp 

cag acc ggg cat gee gcg teg gca 
gin thr gly his ala ala ser ala 

cca gga tgg cga atg etc ggg ggt 
pro gly trp arg met leu gly gly 

age cca acc ggc ggt aca acc gee 
ser pro thr gly gly thr thr ala 

aga gca gga cgt tgt cct cgt cgc 
arg ala gly arg cys pro arg arg 

ggc cac ggc ctt gag cgc ggg gaa 
gly his gly leu glu arg gly glu 

tea gtc ggg cga teg eta ggc gcg 
ser val gly arg ser leu gly ala 

gtt gec acc act ggc egg gcg ccc 
val ala thr thr gly arg ala pro 

tgc tea gtt egg egg ccg acg gca 
cys ser val arg arg pro thr ala 

ccg tta cct cga egg ccg cga ccg 
pro leu pro arg arg pro arg pro 

ttg ggg cgc gca aag tct egg tgc 
leu gly arg ala lys ser arg cys 

ggg cat cac cga ggc ggc get cca 
gly his his arg gly gly ala pro 

acg cgc ggt gtc etc etc atg tga 
thr arg gly val leu leu met OPA 

gec gat gag gec gec cgc get gga 
ala asp glu ala ala arg ala gly 

gtc get gcg gcg ccg ccg gga tag 
val ala ala ala pro pro gly AMB 



31/11 
atg gtg 
met val 
91/31 
ate gcg 
ile ala 
151/51 
ggt ggg 
gly gly 
211/71 
age tgt 
ser cys 
271/91 
cac egg 
his arg 
331/111 
acg ccc 
thr pro 
391/131 
gac egg 
asp arg 
451/151 
gga tgt 
gly cys 
511/171 
gaa age 
glu ser 
571/191 
egg gat 
arg asp 
631/211 
gcg ccg 
ala pro 
691/231 
cct gec 
pro ala 
751/251 
ccc tgg 
pro trp 
811/271 
tat cgc 
tyr arg 
871/291 
tga acc 
OPA thr 
9 31/311 
egg ggc 
arg gly 
991/331 
aat cgc 
asn arg 



ate gag get egg acc cgc agg cat 
ile glu ala arg thr arg arg his 

atg gec age atg ccg cgc cgt egg 
met ala ser met pro arg arg arg 

gca tag eta gcg cgc acc agg tea 
ala AMB leu ala arg thr arg ser 

egg gcg egg gtt aga gcg gta gcg 
arg ala arg val arg ala val ala 

cga agt ggt age cgc gga tga tgt 
arg ser gly ser arg gly OPA cys 

gat tgt cct cac cgt tgg tct ccg 
asp cys pro his arg trp ser pro 

eta gca gtc ggc ggg cca acg cct 
leu ala val gly gly pro thr pro 

gca att cag tea act cga agt age 
ala ile gin ser thr arg ser ser 

cgc tgc gtt gca age cca gta cca 
arg cys val ala ser pro val pro 

age cgt acg cca etc cga gca ttg 
ser arg thr pro leu arg ala leu 

tgg tgt egg egg cct egg cct gtt 
trp cys arg arg pro arg pro val 

age cgc ccc gec gga tgt get cca 
ser arg ala ala gly cys ala pro 

ggt age gca teg cgt cga cat aca 
gly ser ala ser arg arg his thr 

tgg gcg gca gat cga tga gga ata 
trp ala ala asp arg OPA gly ile 

gat gcg tgc ttg cgc acc agt ate 
asp ala cys leu arg thr ser ile 

ttg tag cgt atg gec gtt tec get 
leu AM 3 arg met aia val ser ala 

ccg cga acc agt ggt acg gcg cag 
pro arg thr ser gly thr ala gin 



SEQ ID N° 45ZB 



FIGURE 45ZB 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



150/185 



1021/341 
















1051/351 
















att gac etc 
ile asp leu 
1081/361 


gta 
val 


tea 
ser 


tct 
ser 


gag 
glu 


tta 
leu 


gtt 
val 


gee 
ala 


cgc gca atg 
arg ala met 
1111/371 


ggc 
gly 


ate 
ile 


cgc 
arg 


gtg 
val 


tta 
leu 


teg 
ser 


gta 
val 


tta cgt gac 
leu arg asp 
1141/381 


agt 
ser 


ctg 
leu 


teg 
ser 


gca 
ala 


agg 
arg 


agg 
arg 


gac 
asp 


gca tgc cac 
ala cys his 
1171/391 


tct 
ser 


ccg 
pro 


ate 
ile 


atg 
met 


age 
ser 


age 
ser 


gga 
gly 


tgc ttg acc 
cys leu thr 
1201/401 


aga 
arg 


teg 
ser 


aga 
arg 


gcg 
ala 


etc 
leu 


tct 
ser 


acg 
thr 


ccg aag ate 
pro lys ile 
1231/411 


cca 
pro 


agt 
ser 


teg 
ser 


cat 
his 


cga 
arg 


gtg 
val 


tec 
ser 


gtg gcg ggg 
val ala gly 
1261/421 


get 
ala 


tec 
ser 


gcg 
ala 


cac 
his 


cga 
arg 


ccg 
pro 


cgc 
arg 


ggc ggc gee 
gly gly ala 
1291/431 


tgc 
cys 


agg 
arg 


gcg 
ala 


egg 
arg 


cgt 
arg 


tgt 
cys 


tea 
ser 


tea teg gtc 
ser ser val 
1321/441 


tgg 
trp 


gga 
gly 


tgt 
cys 


tgg 
trp 


ttt 
phe 


ccg 
pro 


gcg 
ala 


tgg cgt tea 
trp arg ser 
1351/451 


aag 
lys 


aga 
arg 


cca 
pro 


tga 
OPA 


teg 
ser 


gaa 

glu 


gtt 
val 


tec cga tac 
ser arg tyr 
1381/461 


tea 
ser 


gcg 
ala 


ttt 
phe 


teg 
ser 


gtt 
val 


ttg 
leu 


teg 
ser 


tga tgt teg 
OPA cys ser 
1411/471 


gtg 
val 


gtg 
val 


tgg 
trp 


tgt 
cys 


atg 
met 


cca 
pro 


tea 
ser 


ccg gtc etc 
pro val leu 
1441/481 


ggt 
gly 


tgt 
cys 


ccg 
pro 


gca 
ala 


gga 
gly 


tgg 
trp 


ate 
ile 


gtg gcg gat 
val ala asp 
1471/491 


egg 
arg 


ctg 
leu 


ctg 
leu 


ggg 

gly 


ctt 
leu 


cgc 
arg 


gec 
ala 


age gtc gta 
ser val val 


cca 
pro 


agg 
arg 


ggg 

gly 


ccg 
pro 


ggg 

gly 


get 
ala 


cat 
his 


tea cca gee 
ser pro ala 


gta 
val 


tgg 
trp 


aag 
1 ys 


ate 
ile 









SEQ ID N° 45ZB (suite) 
FIGURE 45ZB (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCIYFR98/01813 



151/185 



fragment seq45ZA en decalage moins 2 pour la phase de lecture 



1/1 

tct ccc 
ser pro 
61/21 
egg tag 
arg AMB 
121/41 
tec ttg 
ser leu 
181/61 
cgt gec 
arg ala 
241/81 
gcg acc 
ala thr 
301/101 
ggt gaa 
gly glu 
361/121 
tgt gga 
cys gly 
421/141 
ccc gag 
pro glu 
481/161 
ggt cat 
gly his 
541/181 
ctg ctg 
leu leu 
601/201 
cgc gtt 
arg val 
661/221 
ggc tgc 
gly cys 
721/241 
cca cat 
pro his 
781/261 
cgt cag 
arg gin 
841/281 
cgc caa 
arg gin 
901/301 
gac aag 
asp lys 



egg 
arg 

cca 
pro 

cca 
pro 

aga 
arg 

cag 
gin 

gec 
ala 

gag 
glu 

gec 
ala 

cag 
gin 

ttg 
leu 

get 
ala 

cgt 
arg 

tgg 
trp 

ggc 
gly 

cgc 
arg 

ccg 
pro 



aca cca ggt 
thr pro gly 

gag gca cca 
glu ala pro 

etc gcg ate 
leu ala ile 

ccg ggc atg 
pro gly met 

gat ggc gaa 
asp gly glu 

caa ccg gcg 
gin pro ala 

cag gac gtt 
gin asp val 

acg gec ttg 
thr ala leu 

teg ggc gat 
ser gly asp 

cca cca ctg 
pro pro leu 

cag ttc ggc 
gin phe gly 

tac etc gac 
tyr leu asp 

ggc gcg caa 
gly ala gin 

ate acc gag 
ile thr glu 

gcg gtg tec 
ala val ser 

atg agg ccg 
met arg pro 



cat ccg gcg aga 
his pro ala arg 

gca tea gca aca 
ala ser ala thr 

ctt ggg atg acg 
leu gly met thr 

ccg cgt egg caa 
pro arg arg gin 

tgc teg ggg gtc 
cys ser gly val 

gta caa ccg cca 
val gin pro pro 

gtc etc gtc gcg 
val leu val ala 

age gcg ggg aag 
ser ala gly lys 

cgc tag gcg egg 
arg AMB ala arg 

gec ggg cgc ccc 
ala gly arg pro 

ggc cga egg cag 
gly arg arg gin 

ggc cgc gac cgc 
gly arg asp arg 

agt etc ggt gec 
ser leu gly ala 

gcg gcg etc cat 
ala ala leu his 

tec tea tgt gat 
ser ser cys asp 

ccc gcg ctg gac 
pro ala leu asp 



31/11 
tgg tga 
trp OPA 
91/31 
teg cga 
ser arg 
151/51 
gtg ggg 
val gly 
211/71 
get gtc 
ala val 
271/91 
acc ggc 
thr gly 
331/111 
cgc ccg 
arg pro 
391/131 
acc ggc 
thr gly 
451/151 
gat gtg 
asp val 
511/171 
aaa gee 
lys ala 
571/191 
ggg ata 
gly ile 
631/211 
cgc cgt 
arg arg 
691/231 
ctg cca 
leu pro 
751/251 
cct ggg 
pro gly 
811/271 
ate get 
ile ala 
871/291 
gaa ccg 
glu pro 
931/311 
ggg get 
gly ala 



teg agg etc 
ser arg leu 

tgg cca gca 
trp pro ala 

cat age tag 
his ser AMB 

ggg cgc ggg 
gly arg gly 

gaa gtg gta 
glu val val 

att gtc etc 
ile val leu 

tag cag teg 
AMB gin ser 

caa ttc agt 
gin phe ser 

get gcg ttg 
ala ala leu 

gee gta cgc 
ala val arg 

ggt gtc ggc 
gly val gly 

gec gcg ccg 
ala ala pro 

gta gcg cat 
val ala his 

ggg egg cag 
gly arg gin 

atg cgt get 
met arg ala 

tgt age gta 
cys ser val 



gga ccc gca ggc ate 
gly pro ala gly ile 

tgc cgc gee gtc ggg 
cys arg ala val gly 

cgc gca cca ggt cat 
arg ala pro gly his 

tta gag egg tag cgt 
leu glu arg AMB arg 

gee gcg gat gat gtc 
ala ala asp asp val 

acc gtt ggt etc egg 
thr val gly leu arg 

gcg ggc caa cgc etc 
ala gly gin arg leu 

caa etc gaa gta get 
gin leu glu val ala 

caa gec cag tac cac 
gin ala gin tyr his 

cac tec gag cat tgg 
his ser glu his trp 

ggc etc ggc ctg ttc 
gly leu gly leu phe 

ccg gat gtg etc cag 
pro asp val leu gin 

cgc gtc gac ata cac 
arg val asp ile his 

ate gat gag gaa tat 
ile asp glu glu tyr 

tgc gca cca gta teg 
cys ala pro val ser 

tgg ccg ttt ccg etc 
trp pro phe pro leu 



SEQ ID N° 45ZC 
FIGURE 45ZC 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



152/185 



961/321 
















991/331 
















age teg teg 


ctg 


egg 


cgc 


cgc 


egg 


gat 


aga 


ate gee cgc 


gaa 


cca 


gtg 


gta 


egg 


cgc 


aga 


ser ser ser 


leu 


arg 


arg 


arg 


arg 


asp 


arg 


ile ala arg 


glu 


pro 


val 


val 


arg 


arg 


a rg 


1021/341 
















1051/351 














ttg acc teg 


tat 


cat 


ctg 


agt 


tag 


ttg 


ccc 


gcg caa tgg 


gca 


tec 


gcg 


tgt 


tat 


egg 


tat 


leu thr ser 


tyr 


his 


leu 


ser 


AMB 


leu 


pro 


ala gin trp 


ala 


ser 


ala 


cys 


tyr 


arg 


tyr 


1081/361 
















1111/371 










tac gtg aca 


gtc 


tgt 


egg 


caa 


gga 


ggg 


acg 


cat gee act 


etc 


cga 


tea 


tga 


gca 


gcg 


gat 


tyr val thr 


val 


cys 


arg 


gin 


gly 


giy 


thr 


his ala thr 


leu 


arg 


ser 


OPA 


ala 


ala 


asp 


1141/381 
















1171/391 














get tga cca 


gat 


cga 


gag 


cgc 


tct 


eta 


cgc 


cga aga tec 


caa 


gtt 


cgc 


ate 


gag 


tgt 


ccg 


ala OPA pro 


asp 


arg 


glu 


arg 


ser 


leu 


arg 


arg arg ser 


gin 


val 


arg 


ile 


glu 


cys 


pro 


1201/401 
















1231/411 














tgg egg ggg 


ctt 


ccg 


cgc 


acc 


gac 


cgc 


gcg 


gcg gcg cct 


gca 


ggg 


cgc 


ggc 


gtt 


gtt 


cat 


trp arg gly 


leu 


pro 


arg 


thr 


asp 


arg 


ala 


ala ala pro 


ala 


gly 


arg 


gly 


val 


val 


his 


1261/421 
















1291/431 












cat egg tct 


ggg 


gat 


gtt 


ggt 


ttc 


egg 


cgt 


ggc gtt caa 


aga 


gac 


cat 


gat 


egg 


aag 


ttt 


his arg ser 


gly 


asp 


val 


gly phe 


arg 


arg 


gly val gin 


a rg 


asp 


his 


asp 


arg 


lys 


phe 


1321/441 
















1351/451 










ccc gat act 


cag 


cgt 


ttt 


egg 


ttt 


tgt 


cgt 


gat gtt egg 


tgg 


tgt 


ggt 


gta 


tgc 


cat 


cac 


pro asp thr 


gin 


arg 


phe 


arg 


phe 


cys 


arg 


asp val arg 


trp 


cys 


gly 


val 


cys 


his 


his 


1381/461 
















1411/471 
















egg tec teg 


gtt 


gtc 


egg 


cag 


gat 


gga 


teg 


tgg egg ate 


ggc 


tgc 


tgg 


ggc 


ttc 


gcg 


cca 


arg ser ser 


val 


val 


arg 


gin 


asp 


gly 


ser 


trp arg ile 


gly 


cys 


trp 


gly 


phe 


ala 


pro 


1441/481 
















1471/491 












gcg teg tac 


eaa 


ggg 


ggc 


egg 


ggg 


etc 


att 


cac cag ccg 


tat 


gga 


aga 


tc 








ala ser tyr 


gin 


gly 


gly 


arg 


gly 


leu 


ile 


his gin pro 


tyr 


gly 


arg 











SEQ ID N° 45ZC (suite 1) 
FIGURE 45ZC (suite 1) 



ORF de seq 45ZA di rectemen t en fusion avec phoA 



cag tct gtc 


ggc 


aag 


gag 


gga 


cgc 


atg 


cca 


etc tec gat 


cat 


gag 


cag 


egg 








gin ser val 


gly 


lys 


glu 


gly 


arg 


met 


pro 


leu ser asp 


his 


glu 


gin 


a rg 








1141/381 
















1171/391 














atg ctt gac 


cag 


ate 


gag 


age 


get 


etc 


tac 


gec gaa gat 


ccc 


aag 


ttc 


gca 


teg 


agt 


gtc 


met leu asp 


gin 


ile 


glu 


ser 


ala 


leu 


tyr 


ala glu asp 


pro 


lys 


phe 


ala 


ser 


ser 


val 


1201/401 
















1231/411 
















cgt ggc ggg 


ggc 


ttc 


cgc 


gca 


ccg 


acc 


gcg 


egg egg cgc 


ctg 


cag 


ggc 


gcg 


gcg 


ttg 


ttc 


arg gly gly 


gly 


phe 


arg 


ala 


pro 


thr 


ala 


arg arg arg 


leu 


gin 


gly 


ala 


ala 


leu 


phe 


1261/421 
















1291/431 














ate ate ggt 


ctg 


ggg 


atg 


ttg 


gtt 


tec 


ggc 


gtg gcg ttc 


aaa 


gag 


acc 


atg 


ate 


gga 


agt 


ile ile gly 


leu 


gly 


met 


leu 


val 


ser 


gly 


val ala phe 


lys 


glu 


thr 


me t 


ile 


gly 


ser 


1321/441 
















1351/451* 














ttc ccg ata 


etc 


age 


gtt 


ttc 


ggt 


ttt 


gtc 


gtg atg ttc 


ggt 


ggt 


gtg 


gtg 


tat 


gec 


ate 


phe pro ile 


leu 


ser 


val 


phe 


gly 


phe 


val 


val met phe 


gly 


gly 


val 


val 


tyr 


ala 


ile 


1381/461 
















1411/471* 
















acc ggt cct 


egg 


ttg 


tec 


ggc 


agg 


atg 


ga t 


cgt ggc gga 


teg 


get 


get 


ggg 


get 


teg 


cgc 


thr gly pro 


arg 


leu 


ser 


gly 


arg 


met 


asp 


arg gly gly 


ser 


ala 


ala 


gly 


ala 


ser 


arg 


1441/481 
















1471/491 
















cag cgt cgt 


acc 


aag 


ggg 


gec 


ggg 


ggc 


tea 


ttc acc age 


cgt 


a tg 


gaa 


gat 


c 






gin arg arg 


thr 


lys 


gly 


ala 


gly 


giy 


ser 


phe thr ser 


a rg 


met 


glu 


asp 









SEQ ID N° 45A 
FEUILLE DE REMP^C^|E^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



153/185 



Sequence 

Seq45A 

1/1 

atg cca 
Met pro 
61/21 
gaa gat 
glu asp 
121/41 
egg cgc 
arg arg 
181/61 
gcg ttc 
ala phe 
241/81 
atg ttc 
met phe 
301/101 
ggc gga 
gly gly 
361/121 
acc age 
thr ser 



Rv2169c predite par Cole et al., 1998 (Nature 393:537-544) et contenant 



etc tec gat cat gag cag egg atg 
leu ser asp his glu gin arg met 

ccc aag ttc gca teg agt gtc cgt 
pro lys phe ala ser ser val arg 

ctg cag ggc gcg gcg ttg ttc ate 
leu gin gly ala ala leu phe ile 

aaa gag acc atg ate gga agt ttc 
lys glu thr met ile gly ser phe 

ggt ggt gtg gtg tat gee ate acc 
gly gly val val tyr ala ile thr 

teg get get ggg get teg cgc cag 
ser ala ala gly ala ser arg gin 

cgt atg gaa gat egg ttc egg cgc 
arg met glu asp arg phe arg arg 



31/11 
ctt gac 
leu asp 
91/31 
ggc ggg 
gly gly 
151/51 
ate ggt 
ile gly 
211/71 
ccg ata 
pro ile 
271/91 
ggt cct 
gly pro 
331/111 
cgt cgt 
arg arg 
391/131 
cgc ttc 
arg phe 



cag ate gag age get etc tac gec 

gin ile glu ser ala leu tyr ala 

ggc ttc cgc gca ccg acc gcg egg 

gly phe arg ala pro thr ala arg 

ctg ggg atg ttg gtt tec ggc gtg 

leu gly met leu val ser gly val 

etc age gtt ttc ggt ttt gtc gtg 

leu ser val phe gly phe val val 

egg ttg tec ggc agg atg gat cgt 

arg leu ser gly arg met asp arg 

acc aag ggg gec ggg ggc tea ttc 

thr lys gly ala gly gly ser phe 

gac gag taa 

asp glu OCH 



SEQ ID N° 45D 
FIGURE 45D 



ORF d'apres 


Cole 


et 


1/1 








tga cag 


tct 


gtc 


ggc 


OPA gin 


ser 


val 


gly 


61/21 








gac cag 


ate 


gag 


age 


asp gin 


ile 


glu 


ser 


121/41 








ggg ggc 


ttc 


cgc 


gca 


gly gly 


phe 


arg 


ala 


181/61 








ggt ctg 


ggg 


atg 


ttg 


gly leu 


gly 


met 


leu 


241/81 








ata etc 


age 


gtt 


ttc 


ile leu 


ser 


val 


phe 


301/101 








cct egg 


ttg 


tec 


ggc 


pro arg 


leu 


ser 


gly 


361/121 








cgt acc 


aag 


ggg 


gec 


arg thr 


lys 


gly 


ala 


421/141 








ttc gac 


gag 


taa 




phe asp 


glu 


OCH 





1998 (Nature 393:537-544) et contenant Rv2169c 









31/11 


















gga 
gly 


cgc 
arg 


atg 
met 


cca etc 
pro leu 
91/31 


tec 
ser 


gat 

asp 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


atg 
met 


ctt 
leu 


tac 
tyr 


gec 
ala 


gaa 
glu 


gat ccc 
asp pro 
151/51 


aag 
lys 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


cgt 
arg 


ggc 
gly 


gcg 

ala 


egg 
arg 


egg 
arg 


cgc ctg 
arg leu 
211/71 


cag 
gin 


ggc 
gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


ate 
ile 


ate 
ile 


ggc 
gly 


gtg 
val 


gcg 
ala 


ttc aaa 
phe lys 
271/91 


gag 
glu 


acc 
thr 


atg 
met 


ate 
ile 


gga 
gly 


agt 
ser 


ttc 
phe 


ccg 
pro 


gtc 

val 


gtg 
val 


atg 
met 


ttc ggt 
phe gly 
331/111 


ggt 

gly 


gtg 
val 


gtg 

va 1 


tat 
tyr 


gee 

ala 


ate 
lie 


acc 
thr 


ggt 
gly 


gat 
asp 


cgt 
arg 


ggc 
gly 


gga teg 
gly ser 
391/131 


get 
ala 


get 

ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


cag 
gin 


cgt 
arg 


tea 
ser 


ttc 
phe 


acc 
thr 


age cgt 
ser arg 


atg 
me t 


gaa 
q 1 u 


gat 
asp 


egg 
a rg 


ttc 
phe 


egg 
arg 


cgc 
arg 


cgc 
arg 



SEQ ID N° 45F 
FEUILLE DE REM^^E^IEjjg^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



154/185 



1/1 


















31/11 


















cag ccg 
gin pro 
61/21 


cgc 
arg 


cgc 
arg 


ate 
ile 


gac 
asp 


cag 
gin 


ggc 
gly 


etc 
leu 


acg 
thr 


ccc ggt 
pro gly 
91/31 


cac 
his 


ttc 
phe 


tec 
ser 


gcg 
ala 


ttc 
phe 


etc 
leu 


aac 
asn 


aat 
asn 


tec ggt 
ser gly 
121/41 


gaa 
glu 


cat 
his 


cgc 
arg 


acc 
thr 


agg 
arg 


tta 
leu 


ggc 
gly 


age 
ser 


aat ccc 
asn pro 
151/51 


gcg 
ala 


gac 
asp 


ccg 
pro 


cac 
his 


ccc 
pro 


act 
thr 


cgc 
arg 


cga 
arg 


ccg gcc 
pro ala 
181/61 


aac 
asn 


tea 
ser 


cag 
gin 


aca 
thr 


ccc 
pro 


tct 
ser 


acg 
thr 


atg 
met 


cag ggt 
gin gly 
211/71 


atg 
met 


egg 
arg 


acc 
thr 


ccc 
pro 


aga 
arg 


cgc 
arg 


cac 
his 


tgc 
cys 


cgt cgc 
arg arg 
241/81 


ate 
ile 


gcc 
ala 


gtc 
val 


etc 
leu 


gcc 
ala 


gcc 
ala 


gtt 
val 


age 
ser 


ate gcc 
ile ala 
271/91 


gcc 
ala 


act 
thr 


gtc 
val 


gtt 
val 


gcc 
ala 


ggc 
gly 


tgc 
cys 


teg 
ser 


teg ggc 
ser gly 
301/101 


teg 
ser 


aag 
lys 


cca 
pro 


age 
ser 


ggc 
gly 


gga 
gly 


cca 
pro 


ctt 
leu 


ccg gac 
pro asp 
331/111 


gcg 
ala 


aag 

lys 


ccg 
pro 


ctg 
leu 


gtc 
val 


gag 
glu 


gag 
glu 


gcc 
ala 


ace gcg 
thr ala 


cag 
gin 


acc 
thr 


aag 
lys 


get 
ala 


etc 
leu 


aag 
lys 


age 
ser 


gcg 
ala 


cac atg 
his met 


gtg 
val 


ctg 
leu 


acg 
thr 


gtc 
val 


aac 
asn 


ggc 
gly 


aag 
lys 


ate 
ile 



SEQ ID N° 46A 
FIGURE 4 6A 



1/1 

age cgc gcc .gca teg acc agg 

ser arg ala ala ser thr arg 
61/21 

ccg gtg aac ate gca cca ggt 

pro val asn ile ala pro gly 
121/41 

egg cca act cac aga cac cct 

arg pro thr his arg his pro 
181/61 

gtc gca teg ccg tec teg ccg 

val ala ser pro ser ser pro 
241/81 

egg get cga age caa gcg gcg 

arg ala arg ser gin ala ala 
301/101 

ccg cgc aga cca agg etc tea 

pro arg arg pro arg leu ser 



31/11 

gcc tea cgc ccg gtc act 
ala ser arg pro val thr 
91/31 

tag gca gca ate ccg egg 
AMB ala ala ile pro arg 
151/51 

eta cga tgc agg gta tgc 
leu arg cys arg val cys 

211/71 
ccg tta gca teg ccg cca 
pro leu ala ser pro pro 

271/91 

gac cac ttc egg acg cga 
asp his phe arg thr arg 

331/111 
aga gcg cgc aca tgg tgc 
arg ala arg thr trp cys 



SEQ ID N° 46B 
FIGURE 4 6B 



tct ccg cgt tec tea aca att 
ser pro arg ser ser thr ile 

acc cgc acc cca etc gcc gac 
thr arg thr pro leu ala asp 

gga ccc cca gac gcc act gcc 
gly pro pro asp ala thr aia 

ctg teg ttg ccg get get cgt 
leu ser leu pro aia ala arg 

age cgc tgg teg agg agg cca 
ser arg trp ser arg arg pro 

tga egg tea acg gca aga tc 
0?A arg ser thr ala arg 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



155/185 



1/1 


















31/11 


















gcc gcg 
ala ala 
61/21 


ccg 
pro 


cat 
his 


cga 
arg 


cca 
pro 


ggg 

gly 


cct 
pro 


cac 
his 


gcc 
ala 


egg tea 
arg ser 
91/31 


ctt 
leu 


etc 
leu 


cgc 
arg 


gtt 
val 


cct 
pro 


caa 
gin 


caa 
gin 


ttc 
phe 


egg tga 
arg OPA 
121/41 


aca 
thr 


teg 
ser 


cac 
his 


cag 
gin 


gtt 

val 


agg 
arg 


cag 
gin 


caa 
gin 


tec cgc 
ser arg 
151/51 


gga 
gly 


ccc 
pro 


gca 
ala 


ccc 
pro 


cac 
his 


teg 
ser 


ccg 
pro 


acc 
thr 


ggc caa 
gly gin 
181/61 


etc 
leu 


aca 
thr 


gac 
asp 


acc 
thr 


etc 
leu 


tac 
tyr 


gat 
asp 


gca 
ala 


ggg tat 
gly tyr 
211/71 


gcg 
ala 


gac 
asp 


ccc 
pro 


cag 
gin 


acg 
thr 


cca 
pro 


ctg 
leu 


ccg 
pro 


teg cat 
ser his 
241/81 


cgc 
arg 


cgt 
arg 


cct 
pro 


cgc 
arg 


cgc 
arg 


cgt 
arg 


tag 
AMB 


cat 
his 


cgc cgc 
arg arg 
271/91 


cac 
his 


tgt 
cys 


cgt 
arg 


tgc 
cys 


egg 
arg 


ctg 
leu 


etc 
leu 


gtc 
val 


ggg etc 
gly leu 
301/101 


gaa 
glu 


gcc 
ala 


aag 
lys 


egg 
arg 


egg 
arg 


acc 
thr 


act 
thr 


tec 
ser 


gga cgc 
gly arg 
331/111 


gaa 
glu 


gcc 
ala 


get 
ala 


ggt 
gly 


cga 
arg 


gga 
gly 


ggc 
gly 


cac 
his 


cgc gca 
arg ala 


gac 
asp 


caa 
gin 


ggc 
gly 


tct 
ser 


caa 
gin 


gag 
glu 


cgc 
arg 


gca 
ala 


cat ggt 
his gly 


get 
ala 


gac 
asp 


ggt 
gly 


caa 
gin 


egg 
arg 


caa 
gin 


gat 
asp 


c 



SEQ ID N° 46C 
FIGURE 4 6C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



156/185 



Sequence codante Rvl411c predite par Cole et al., 1998 (Nature 393: 537-544) 
contenant seq46A: 



1/1 

atg egg acc ccc aga cgc cac 

Met arg thr pro arg arg his 
61/21 

gec act gtc gtt gec ggc tgc 

ala thr val val ala gly cys 
121/41 

gcg aag ccg ctg gtc gag gag 

ala lys pro leu val glu glu 
181/61 

gtg ctg acg gtc aac ggc aag 

val leu thr val asn gly lys 
241/81 

acc acc aac ccc acc gec gcg 

thr thr asn pro thr ala ala 
301/101 

gat gec gac ttc gtg gtg ttc 

asp ala asp phe val val phe 
361/121 

age gat ttc ggt ccc gec gec 

ser asp phe gly pro ala ala 
421/141 

ggc ctg gec aac gtg ctg gcg 

gly leu ala asn val leu ala 
481/161 

aac ggc cag aac acc ate cgc 

asn gly gin asn thr ile arg 
541/181 

gcg ccg ccg ttc aac gcg acg 

ala pro pro phe asn ala thr 
601/201 

gat cat caa ctg gca cag gec 

asp his gin leu ala gin ala 
661/221 

ttg teg aaa tgg ggc gag aag 

leu ser lys trp gly glu lys 



31/11 

tgc cgt cgc ate gec gtc 

cys arg arg ile ala val 
91/31 

teg teg ggc teg aag cca 

ser ser gly ser lys pro 
151/51 

gec acc gcg cag acc aag 

ala thr ala gin thr lys 
211/71 

ate ccg gga ctg tct ctg 

ile pro gly leu ser leu 

271/91 

acg gga aac gtc aag etc 

thr gly asn val lys leu 

331/111 

gac ggg ate ctg tac gec 

asp gly ile leu tyr ala 

391/131 

gac ate tac gac ccc gec 

asp ile tyr asp pro ala 

451/151 

aat ttc gec gac gca aaa 

asn phe ala asp ala lys 

■ 511/171 

ate age ggg aag gta teg 

ile ser gly lys val ser 

571/191 

cag ccg gtg ccg gcg acc 

gin pro val pro ala thr 

631/211 

cag ttg gac cgc ggc teg 

gin leu asp arg gly ser 

691/231 

gtc cag gtc acg aag ccc 

val gin val thr lys pro 



etc gec gec gtt age ate gec 

leu ala ala val ser ile ala 

age ggc gga cca ctt ccg gac 

ser gly gly pro leu pro asp 

get etc aag age gcg cac atg 

ala leu lys ser ala his met 

aag acg ctg age ggc gat etc 

lys thr leu ser gly asp leu 

acg ctg ggt ggg tct gat ate 

thr leu gly gly ser asp ile 

acc ctg acg ccc aac cag tgg 

thr leu thr pro asn gin trp 

cag gtg ctg aat ccg gat acc 

gin val leu asn pro asp thr 

gec gaa ggg egg gat acc ate 

ala glu gly arg asp thr ile 

gca cag gcg gtg aac cag ata 

ala gin ala val asn gin ile 

gtc tgg att cag gag acc ggc 

val trp ile gin glu thr gly 

ggc aat tec gtc cag atg acc 

gly asn ser val gin met thr 



ccg gtg age tga 
pro val ser OPA 



SEQ ID N° 4 6D 
FIGURE 4 6D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



157/185 

ORF cTapres par Cole et al . , 1998 (Nature 393: 537-544) 
et contenant la sequence codante Rvl411c: 



1/1 






tag etc 


acc 


cag 


AMB leu 


thr 


gin 


61/21 






gtc ggg 


caa 


tac 


val gly 


gin 


tyr 


121/41 






gec ggc 


gtc 


ggc 


ala gly 


val 


gly 


181/61 






etc acg 


ccc 


ggt 


leu thr 


pro 


gly 


241/81 






ggc age 


aat 


ccc 


gly ser 


asn 


pro 


301/101 






acg atg 


cag 


ggt 


thr met 


gin 


gly 


361/121 






gtt age 


ate 


gec 


val ser 


ile 


ala 


421/141 






cca ctt 


ccg 


gac 


pro leu 


pro 


asp 


481/161 






age gcg 


cac 


atg 


ser ala 


his 


met 


541/181 






age ggc 


gat 


etc 


ser gly 


asp 


leu 


601/201 






ggg tct 


gat 


ate 


gly ser 


asp 


ile 


661/221 






ccc aac 


cag 


tgg 


pro asn 


gin 


trp 


721/241 






aat ccg 


gat 


acc 


asn pro 


asp 


thr 


781/261 






egg gat 


acc 


ate 


arg asp 


thr 


ile 


841/281 






gtg aac 


cag 


ata 


val asn 


gin 


ile 


901/301 






cag gag 


acc 


ggc 


gin glu 


thr 


gly 


961/321 






gtc cag 


atg 


acc 


val gin 


met 


thr 


1021/341 




tga 






OPA 







gtt gga ccg gtt 
val gly pro val 

ate gac gac cgt 
ile asp asp arg 

ggt aac cat egg 
gly asn his arg 

cac ttc tec gcg 
his phe ser ala 

gcg gac ccg cac 
ala asp pro his 

atg egg acc ccc 
met arg thr pro 

gee act gtc gtt 
ala thr val val 

gcg aag ccg ctg 
ala lys pro leu 

gtg ctg acg gtc 
val leu thr val 

acc acc aac ccc 
thr thr asn pro 

gat gec gac ttc 
asp ala asp phe 

age gat ttc ggt 
ser asp phe gly 

ggc ctg gec aac 
gly leu ala asn 

aac ggc cag aac 
asn gly gin asn 

gcg ccg ccg ttc 
ala pro pro phe 

gat cat caa ctg 
asp his gin leu 

ttg teg aaa tgg 
leu ser lys trp 



31/11 
cag tgt etc ggc 
gin cys leu gly 

91/31 
cag aca cac gec 
gin thr his ala 

151/51 
acc gcg gat ggt 
thr ala asp gly 

211/71 
ttc etc aac aat 
phe leu asn asn 

271/91 
ccc act cgc cga 
pro thr arg arg 

331/111 
aga cgc cac tgc 
arg arg his cys 

391/131 
gee ggc tgc teg 
ala gly cys ser 

451/151 
gtc gag gag gec 
val glu glu ala 

511/171 
aac ggc aag ate 
asn gly lys ile 
■ 571/191 
acc gee gcg acg 
thr ala ala thr 

631/211 
gtg gtg ttc gac 
val val phe asp 

691/231 
ccc gec gec gac 
pro ala ala asp 

751/251 
gtg ctg gcg aat 
val leu ala asn 

811/271 
acc ate cgc ate 
thr ile arg ile 

871/291 
aac gcg acg cag 
asn ala thr gin 

931/311 
gca cag gec cag 
ala gin ala gin 

991/331 
ggc gag aag gtc 
gly glu lys val 



cat cac gtc ggc 
his his val gly 

gtt gac age gat 
val asp ser asp 

cag ccg cgc cgc 
gin pro arg arg 

tec ggt gaa cat 
ser gly glu his 

ccg gec aac tea 
pro ala asn ser 

cgt cgc ate gec 
arg arg ile ala 

teg ggc teg aag 
ser gly ser lys 

acc gcg cag acc 
thr ala gin thr 

ccg gga ctg tct 
pro gly leu ser 

gga aac gtc aag 
gly asn val lys 

ggg ate ctg tac 
gly ile leu tyr 

ate tac gac ccc 
ile tyr asp pro 

ttc gec gac gca 
phe ala asp ala 

age ggg aag gta 
ser gly lys val 

ccg gtg ccg gcg 
pro val pro ala 

ztq gac cgc ggc 
leu asp arg gly 

cag gtc acg aag 
gin val thr lys 



ggt gaa ttg gee 
gly glu leu ala 

cga gtc gee gtg 
arg val ala val 

ate gac cag ggc 
ile asp gin gly 

cgc acc agg tta 
arg thr arg leu 

cag aca ccc tct 
gin thr pro ser 

gtc etc gee gee 
val leu ala ala 

cca age ggc gga 
pro ser gly gly 

aag get etc aag 
lys ala leu lys 

ctg aag acg ctg 
leu lys thr leu 

etc acg ctg ggt 
leu thr leu gly 

gee acc ctg acg 
ala thr leu thr 

gec cag gtg ctg 
ala gin val leu 

aaa gee gaa ggg 
lys ala glu gly 

teg gca cag gcg 
ser ala gin ala 

acc gtc tgg att 
thr val trp ile 

teg ggc aat tec 
ser gly asn ser 

ccc ccg gtg age 
pro pro val ser 



SEQ ID N° 46F 



FEUILLE DE REMrajKGEfflENT$REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



158/185 



1/1 31/11 



gag ctg 
glu leu 
61/21 


gtc 
val 


aac 
asn 


ggc 

g!y 


gcc 
ala 


ggc 
gly 


ate 
ile 


gac 
asp 


gac 
asp 


gcc gcc 
ala ala 
91/31 


gtc 
val 


gtg 
val 


acc 
thr 


tgc 
cys 


egg 
arg 


ccg 


gac 
asp 


age 
ser 


ctg gcc 
leu ala 


gat 
asp 


gcc 
ala 


cag 
gin 


cag 
gin 


atg 
met 


gtc 
val 


gag 
glu 


gcg 
ala 


gca ctg 
ala leu 
151/51 


ggc 
gly 


cga 
arg 


tat 
tyr 


ggc cgt 
gly arg 


ttg 
leu 


gac 
asp 


gga 
gly 


gtg ttg 
val leu 
181/61 


gtg 
val 


gcc 
ala 


teg 
ser 


ggc 
gly 


age 
ser 


aac 
asn 


cat 
his 


gtg 
val 


gcg ccc 
ala pro 
211/71 


att 
ile 


acc 
thr 


gag 
glu 


atg 
met 


gcc 
ala 


gtc 
val 


gag 
glu 


gac 
asp 


ttc gac 
phe asp 
241/81 


get 
ala 


gtg 
val 


atg 
met 


gac 
asp 


gcg 
ala 


aac 
asn 


gtg 
val 


egg 
arg 


ggt gcc 
gly ala 
271/91 


tgg 
trp 


ctg 
leu 


gtg 
val 


tgt 

cys 


egg 
arg 


gcg 
ala 


gcc 
ala 


gga 
gly 


egg gtg 
arg val 
301/101 


ctg 
leu 


etc 
leu 


gag 
glu 


cag 
gin 


ggt 
gly 


cag 
gin 


ggc 
gly 


ggc 
gly 


age gtg 
ser val 
331/111 


gtg 
val 


ctg 
leu 


gtg 
val 


teg 
ser 


tec 
ser 


gtt 
val 


cgc 
arg 


ggc 
gly 


ggg ttg 
gly leu 


ggc 

gly 


ad L 

asn 


gcc 
ala 


gcc 
ala 


ggt 
gly 


cac 
ty r 


age 
ser 


gcg 
ala 


tac tgc 
tyr cys 


ccg 
pro 


teg 
ser 


aag 
lys 


gcg 
ala 


ggc 
gly 


acc 
thr 


gat 
asp 


c 
















SEQ ID 


N° 47A 






























FIGURE 4 7A 


















1/1 


















31/11 


















age tgg 
ser trp 
61/21 


tea 
ser 


acg 
.thr 


gcg 
ala 


ccg 
pro 


gca 
ala 


teg 
ser 


acg 
thr 


acg 
thr 


ccg ccg 
pro pro 
91/31 


teg 
ser 


tga 
OPA 


cct 
pro 


gcc 
ala 


ggc 
gly 


egg 
a rc 


aca 
thr 


gcc 
ala 


tgg ccg 
trp pro 
121/41 


atg 
met 


ccc 
pro 


age 
ser 


aga 
arg 


tgg 
trp 


teg 
ser 


agg 
arg 


egg 
arg 


cac tgg 
his trp 
151/51* 


gcc 
ala 


gat 
asp 


atg 
met 


gcc 
ala 


gtt 
val 


tgg 
trp 


acg 
thr 


gag 
glu 


tgt tgg 
cys trp 
181/61 


tgg 
trp 


cct 
pro 


egg 
arg 


gca 
ala 


gca 
ala 


acc 
thr 


atg 
met 


tgg 
trp 


cgc cca 
arg pro 
211/71 


tta 
leu 


ccg 
pro 


aga 
arg 


tgg 
trp 


ccg 
pro 


teg 
ser 


agg 
arg 


act 
thr 


teg acg 
ser thr 
241/81 


ctg 
leu 


tga 
OPA 


tgg 
trp 


acg 
thr 


cga 
arg 


acg 
thr 


tgc 
cys 


ggg 

gly 


gtg cct 
val pro 
271/91 


ggc 
gly 


tgg 
trp 


tgt 
cys 


gtc 
val 


ggg 

gly 


egg 
arg 


ccg 
pro 


gac 
asp 


ggg tgc 
gly cys 
301/101 


tgc 
cys 


teg 
ser 


age 
ser 


agg 
arg 


gtc 
val 


agg 
arg 


gcg 
ala 


gca 
ala 


gcg tgg 
ala trp 
331/111 


tgc 

cys 


tgg 
trp 


tgt 
cys 


cgt 
arg 


ccg 
pro 


ttc 
phe 


gcg 
ala 


gcg 
ala 


ggt tgg 
gly trp 


gca 
ala 


atg 
met 


ccg 
pro 


ccg 
pro 


gtt 
val 


aca 
thr 


gcg 
ala 


cgt 
arg 


act gcc 
thr ala 


cgt 
a rg 


cga 
arg 


agg 
arg 


egg 
a rg 


gca 
ala 


ccg 
pro 


ate 
ile 





SEQ ID N° 47B 
FIGURE 47B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



159/185 



1/1 






get ggt 


caa 


egg 


ala gly 


gin 


arg 


61/21 






ggc cga 


tgc 


cca 


gly arg 


cys 


pro 


121/41 






gtt ggt 


ggc 


etc 


val gly 


gly 


leu 


181/61 






cga cgc 


tgt 


gat 


arg arg 


cys 


asp 


241/81 






ggt get 


get 


cga 


gly ala 


ala 


arg 


301/101 






gtt ggg 


caa 


tgc 


val gly 


gin 


cys 



cgc egg cat cga 
arg arg his arg 

gca gat ggt cga 
ala asp gly arg 

ggg cag caa cca 
gly gin gin pro 

gga cgc gaa cgt 
gly arg glu arg 

gca ggg tea ggg 
ala gly ser gly 

cgc egg tta cag 
arg arg leu gin 







31/11 


cga 


cgc 


rnr cert" 


arg 


arcr 


arg arg 






91/31 


ggc 


ggc 


act aaa 


gly 


gly 


thr gly 






151/51 


tgt 


ggc 


gec cat 


cys 


gly 


ala his 






211/71 


gcg 


ggg 


tgc ctg 


ala 


gly 


cys leu 






271/91 


egg 


cag 


cgt ggt 


arg 


gin 


arg gly 






331/111 


cgc 


gta 


ctg ccc 


arg 


val 


leu pro 



cgt gac ctg ccg 
arg asp leu pro 

ccg ata tgg ccg 
pro ile trp pro 

tac cga gat ggc 
tyr arg asp gly 

get ggt gtg teg 
ala gly val ser 

get ggt gtc gtc 
ala gly val val 

gtc gaa ggc ggg 
val glu gly gly 



gec gga cag cct 
ala gly gin pro 

ttt gga egg agt 
phe gly arg ser 

cgt cga gga ctt 
arg arg gly leu 

ggc ggc egg acg 
gly gly arg thr 

cgt teg egg egg 
arg ser arg arg 

cac cga tc 
his arg 



SEQ ID N° 47C 
FIGURE 47C 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



160/185 



Sequence codante Rvl714 predite par Cole et al., 1998 (Nature 393: 537-544) et 
contenant seq 47A: 



1/1 








gtg gag 


gaa 


atg 


gcg 


val glu 


glu 


met 


ala 


61/21 








cag gac 


aag 


teg 


ate 


gin asp 


lys 


ser 


ile 


121/41 








gcg ctg 


gcc 


gac 


gcg 


ala leu 


ala 


asp 


ala 


181/61 








gag ctg 


gtc 


aac 


ggc 


glu leu 


val 


asn 


gly 


241/81 








ctg gcc 


gat 


gcc 


cag 


leu ala 


asp 


ala 


gin 


301/101 








gtg ttg 


gtg 


gcc 


teg 


val leu 


val 


ala 


ser 


361/121 








ttc gac 


get 


gtg 


atg 


phe asp 


ala 


val 


met 


421/141 








egg gtg 


ctg 


etc 


gag 


arg val 


leu 


leu 


glu 


481/161 








ggg ttg 


ggc 


aat 


gcc 


gly leu 


gly 


asn 


ala 


541/181 








ttg gcc 


aag 


aca 


ttg 


leu ala 


lys 


thr 


leu 


601/201 








ccg acg 


gtg 


ttt 


egg 


pro thr 


val 


phe 


arg 


661/221 








gcc acc 


egg 


gag 


gcg 


ala thr 


a rg 


glu 


ala 


721/241 








ttc gtc 


ggc 


gcc 


ctg 


phe val 


gly 


ala 


leu 


781/261 








atg tat 


ctg 


gac 


ggc 


met tyr 


leu 


asp 


gly 



ctg get cag cag gtg 
leu ala gin gin val 

ctg ate acc ggc gcg 
leu ile thr gly ala 

gga gcg egg ctg aca 
gly ala arg leu thr 

gcc ggc ate gac gac 
ala gly ile asp asp 

cag atg gtc gag gcg 
gin met val glu ala 

ggc age aac cat gtg 
gly ser asn his val 

gac gcg aac gtg egg 
asp ala asn val arg 

cag ggt cag ggc ggc 
gin gly gin gly gly 

gcc ggt tac age gcg 
ala gly tyr ser ala 

gcg gcc gaa tgg ggc 
ala ala glu trp gly 

tec gcg gtg acc gag 
ser ala val thr glu 

atg etc gcc egg ate 
met leu ala arg ile 

ate tat ctg etc age 
ile tyr leu leu ser 

ggg tac acc gca tgc 
gly tyr thr ala cys 



31/11 








ccg aac 


ctg 


ggt 


ctg 


pro asn 


leu 


gly 


leu 


91/31 








acc ggt 


teg 


ttg 


ggc 


thr gly 


ser 


leu 


gly 


151/51 








ctg gcc 


ggc 


ggc 


aac 


leu ala 


gly 


gly 


asn 


211/71 








gcc gcc 


gtc 


gtg 


acc 


ala ala 


val 


val 


thr 


271/91 








gca ctg 


ggc 


cga 


tat 


ala leu 


gly 


arg 


tyr 


331/111 








gcg ccc 


att 


acc 


gag 


ala pro 


ile 


thr 


glu 


391/131 








ggt gcc 


tgg 


ctg 


gtg 


gly ala 


trp 


leu 


val 


451/151 








age gtg 


gtg 


ctg 


gtg 


ser val 


val 


leu 


val 


511/171 








tac tgc 


ccg 


teg 


aag 


tyr cys 


pro 


ser 


lvs 


571/191 








ggt cac 


ggc 


att 


egg 


gly his 


gly 


ile 


arg 


631/211 








tgg atg 


ttc 


acc 


gac 


trp met 


phe 


thr 


asp 


691/231 








ccg ttg 


cgc 


cgc 


ttc 


pro leu 


arg 


arg 


phe 


751/251 








gac gcc 


teg 


age 


ttc 


asp ala 


ser 


ser 


phe 


811/271 








tga 








OPA 









gcg cgc ttc age gtg 
ala arg phe ser val 

cga gtt gcc gcc egg 
arg val ala ala arg 

teg gcc ggt ctg gcc 
ser ala gly leu ala 

tgc egg ccg gac age 
cys arg pro asp ser 

ggc cgt ttg gac gga 
gly arg leu asp gly 

atg gcc gtc gag gac 
met ala val glu asp 

tgt egg gcg gcc gga 
cys arg ala ala gly 

teg tec gtt cgc ggc 
ser ser val arg gly 

gcg ggc acc gat ctg 
ala gly thr asp leu 

gtg aac gcg ctg gcg 
val asn ala leu ala 

gat ccg aag ggc egg 
asp pro lys gly arg 

gcc gaa ccg gaa gac 
ala glu pro glu asp 

tac acc ggc cag gtg 
tyr thr gly gin val 



SEQ ID N° 47D 



FIGURE 47D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



161/185 



ORF d'apres Cole et al . , 1998 (Nature 393: 537-544) et contenant la sequence 
codante Rvl714: 



24/1 

tag gtg gag gaa atg gcg ctg get cag cag 
AMB val glu glu met ala leu ala gin gin 
84/21 

gtg cag gac aag teg ate ctg ate acc ggc 
val gin asp lys ser ile leu ile thr gly 
144/41 

egg gcg ctg gec gac gcg gga gcg egg ctg 
arg ala leu ala asp ala gly ala arg leu 
204/61 

gec gag ctg gtc aac ggc gec ggc ate gac 
ala glu leu val asn gly ala gly ile asp 
264/81 

age ctg gec gat gec cag cag atg gtc gag 
ser leu ala asp ala gin gin met val glu 
324/101 

gga gtg ttg gtg gee teg ggc age aac cat 
gly val leu val ala ser gly ser asn his 
384/121 

gac ttc gac get gtg atg gac gcg aac gtg 
asp phe asp ala val met asp ala asn val 
444/141 

gga egg gtg ctg etc gag cag ggt cag ggc 
gly arg val leu leu glu gin gly gin gly 
504/161 

ggc ggg ttg ggc aat gec gee ggt tac age 
gly gly leu gly asn ala ala gly tyr ser 
564/181 

ctg ttg gee aag aca ttg gcg gee gaa tgg 
leu leu ala lys thr leu ala ala glu trp 
624/201 

gcg ccg acg gtg ttt egg tec gcg gtg acc 
ala pro thr val phe arg ser ala val thr 
684/221 

egg gee acc egg gag gcg atg etc gec egg 
arg ala thr arg glu ala met leu ala arg 
744/241 

gac ttc gtc ggc gec ctg ate tat ctg etc 
asp phe val gly ala leu ile tyr leu leu 
804/261 

gtg atg tat ctg gac ggc ggg tac acc gca 
val met tyr leu asp gly gly tyr thr ala 



54/11 

gtg ccg aac ctg ggt ctg gcg cgc ttc age 
val pro asn leu gly leu ala arg phe ser 
114/31 

gcg acc ggt teg ttg ggc cga gtt gec gee 
ala thr gly ser leu gly arg val ala ala 
174/51 

aca ctg gee ggc ggc aac teg gec ggt ctg 
thr leu ala gly gly asn ser ala gly leu 
234/71 

gac gec gec gtc gtg acc tgc egg ccg gac 
asp ala ala val val thr cys arg pro asp 

294/91 

gcg gca ctg ggc cga tat ggc cgt ttg gac 
ala ala leu gly arg tyr gly arg leu aso 
354/111 

gtg gcg ccc att acc gag atg gec gtc gag 
val ala pro ile thr glu met ala val glu 
414/131 

egg ggt gee tgg ctg gtg tgt egg gcg gec 
arg gly ala trp leu val cys arg ala ala 
474/151 

ggc age gtg gtg ctg gtg teg tec gtt cgc 
gly ser val val leu val ser ser val arg 
534/171 

gcg tac tgc ccg teg aag gcg ggc acc gat 
ala tyr cys pro ser lys ala gly thr asp 
594/191 

ggc ggt cac ggc att egg gtg aac gcg ctg 
gly gly his gly ile arg val asn ala leu 
654/211 

gag tgg atg ttc acc gac gat ccg aag ggc 
glu trp met phe thr asp asp pro lys gly 
714/231 

ate ccg ttg cgc cgc ttc gec gaa ccg gaa 
ile pro leu arg arg one ala glu pro glu 
774/251 

age gac gec teg age ttc tac acc ggc cag 
ser asp ala ser ser phe tyr thr gly gin 
834/271 
tgc tga 

cys OPA 



SEQ ID N° 47F 



FIGURE 47F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



162/185 



1/1 31/11 

agg etc atg age aag acg gtt etc ate ctt ggc gcg ggt gtc ggc ggc ctg acc acc gec 

arg leu met ser lys thr val leu ile leu gly ala gly val gly gly leu thr thr ala 

61/21 91/31 

gac acc etc cgt caa ctg eta cca cct gag gat c 

asp thr leu arg gin leu leu pro pro glu asp 



SEQ ID N° 48A 
FIGURE 4 8A 



1/1 31/11 

ggc tea tga gca aga egg ttc tea tec ttg gcg egg gtg teg gcg gec tga cca ccg ccg 

gly ser OPA ala arg arg phe ser ser leu ala arg val ser ala ala OPA pro pro oro 

61/21 91/31 

aca ccc tec gtc aac tgc tac cac ctg agg ate 

thr pro ser val asn cys tyr his leu arg ile 



SEQ ID N° 48B 
FIGURE 48B 



1/1 31/11 

get cat gag caa gac ggt tct cat cct tgg cgc ggg tgt egg egg cct gac cac cgc cga 

ala his glu gin asp gly ser his pro trp arg gly cys arg arg pro asD his arq arq 
61/21 

cac cct ccg tea act get acc acc tga gga tc 

his pro pro ser thr ala thr thr OPA gly 



SEQ ID N° 48C 
FIGURE 4 8C 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



163/185 



Sequence codante Rv0331 predite par 
seq4 8A: 

1/1 

atg age aag acg gtt etc ate ctt ggc 
Met ser lys thr val leu ile leu gly 
61/21 

etc cgt caa ctg eta cca cct gag gat 
leu arg gin leu leu pro pro glu asp 
121/41 

acg ctg ggc ttg teg ttg eta tgg gtg 
thr leu gly leu ser leu leu trp val 
181/61 

gtc cgc ccc acc gcg gcg teg ctg ccc 
val arg pro thr ala ala ser leu pro 
241/81 

att gac ate gcg gec cag gta gtg cac 
ile asp ile ala ala gin val val hi3 
301/101 

gtg ate gca tta ggt gcg gcg ctg aac 
val ile ala leu gly ala ala leu asn 
361/121 

gac gec gac gtc gcg ggc cag ttc tac 
asp ala asp val ala gly gin phe tyr 
421/141 



gtc gag gcg etc gag cat ggc egg ate 
val glu ala leu glu his gly arg ile 
481/161 



cca gec 
pro ala 
541/181 


gca 
ala 


ccg 
pro 


ttc 
phe 


gaa 
glu 


gcg 
ala 


gcg 
ala 


ttt 

phe 


acc gga 
thr gly 
601/201 


acc 
thr 


gta 
val 


cag 
gin 


ate 
ile 


gac 
asp 


acg 
thr 


ttc 
phe 


ccc gag 
pro glu 
661/221 


gtc 
val 


ggc 
gly 


gag 
glu 


get 
ala 


ttg 
leu 


gtc 
val 


teg 
3er 


cgc aag 
arg lys 
721/241 


gec 
ala 


eta 

leu 


get 
ala 


cgc 
arg 


gtc 
val 


gat 
asp 


gag 
glu 


tec gaa ccg 
ser glu pro 
781/261 


ttc 
phe 


gat 
asp 


ctg 
leu 


ctt 
leu 


gec 
ala 


gtg 
val 


tea gcg 
ser ala 
841/281 


ggt 
gly 


etc 
leu 


age 
ser 


gaa 
glu 


tec 
ser 


ggg 

gly 


tgg 
trp 



gec gac aac gtg tgg gec ate ggc gat 
ala asp asn val trp ala ile gly asp 
901/301 

ctg ccc aag get gee gtg ttc gee gaa 
leu pro lys ala ala val phe ala glu 
961/321 

cgc cat etc ggt tac gac gta get gag 
arg his leu gly tyr asp val ala glu 
1021/341 

gag acc ggt gat cac cag gca gec aag 
glu thr gly asp his gin ala ala lys 
1081/361 

teg gtg acg ctg tac ccg ccg teg egg 
ser val thr leu tyr pro pro ser arg 
1141/391 

gec tgg ctg acc cgc tgg aag acg tga 
ala trp leu thr arg trp lys thr 0?A 



Cole et al., 1998 (Nature 393: 537-544) et contenant 



31/11 



gcg 


ggt gtc 


ggc 


ggc 


ctg 


acc 


acc 


gee 


gac 


acc 


ala 


gly val 


gly 


gly 


leu 


thr 


thr 


ala 


asp 


thr 




91/31 
















cga 


ate ata 


ttg 


gtg 


gac 


agg 


age 


ttt 


gac 


ggg 


arg 


ile ile 


leu 


val 


asp 


arg 


ser 


phe 


asp gly 




151/51 


















ttg 


egg ggc 


tgg 


egg 


egg 


cct 


gac 


gac 


gtc 


cgc 


leu 


arg gly 


trp 


arg 


arg 


pro 


asp 


asp 


val 


arg 




211/71 
















ggt 


gtg gaa 


atg 


gtt 


act 


gca 


acc 


gtc 


gec 


cac 


gly val glu met 


val 


thr 


ala 


thr 


val 


ala 


his 



271/91 



acc 
thr 


gac aac 
asp asn 
331/111 


age 
ser 


gtc 
val 


ate 
ile 


ggc 
gly 


tat 
tyr 


gac 
asp 


gcg 
ala 


ttg 
leu 


acc 
thr 


gac gec 
asp ala 
391/131 


gtt 
val 


ccc 
pro 


gga 
gly 


ctg 
leu 


teg 
ser 


gac 
asp 


gcg 
ala 


etc 
leu 


acc 
thr 


ctg gac ggc 
leu asp gly 
451/151 


gcg 
ala 


get 
ala 


gag 
glu 


ctg 
leu 


cgt 
arg 


gcg 
ala 


aag 
lys 


get 
ala 


gtg get 
val ala 
511/171 


ate 
ile 


gee 
ala 


ggg 

gly 


gtg 
val 


ccg 
pro 


ttc 
phe 


aaa 
lys 


tgc 
cys 


ctg 
leu 


ate gec 
ile ala 
571/191 


gec 
ala 


caa 

gin 


etc 
leu 


ggt 
gly 


gac 
asp 


cgc 
arg 


tac 
tyr 


gec 
ala 


acg 
thr 


cct gac 
pro a3p 
6317211 


ccg 
pro 


ctg 
leu 


ccg 
pro 


atg 
met 


ccc 
pro 


gtt 
val 


gca 
ala 


ggt 
gly 


atg 
met 


etc aag 
leu lys 
691/231 


gat 
asp 


cac 
his 


ggt 
gly 


gtc 
val 


ggc 
gly 


ttc 
phe 


cat 
his 


cct 
pro 


gee 
ala 


gca agg 
ala arg 

751/251 


acg 
thr 


atg 
met 


cac 
hi 3 


ttc 
phe 


ggt 
gly 


gac 
asp 


ggc 
gly 


acg 
thr 


gtc 
val 


ccc ccg 
pro pro 


cac 
his 


gtg 
val 


ccc 
pro 


tec 
ser 


gee 
ala 


gcg 
ala 


gcg 
ala 


egg 
arg 



811/271 



ata ccc gtg gac ccg cgc acc ctg tec act age 
ile pro val asp pro arg thr leu ser thr ser 
871/291 



gcg 


acc gtg 


ctg 


acg 


ctg 


ccg 


aat 


ggc 


aaa 


ccg 


ala 


thr val 


leu 


thr 


leu 


pro 


asn 


gly 


lys 


pro 




931/311 
















gee 


cag gee 


gca 


gtt 


gtc 


gee 


cac 


ggc 


gtc 


gec 


ala 


gin ala 


ala 


val 


val 


ala 


his 


gly 


val 


ala 




991/331 
















cgc 


cac ttc 


acc 


ggc 


acg 


ggc 


gec 


tgc 


tac 


gtc 


arg 


his phe 


thr 


gly 


thr 


gly 


ala 


cys 


tyr 


val 




1051/351 














ggc 


gac ggc 


gat 


ttc 


ttc 


get 


ccg 


teg 


gcg 


ccc 


gly 


asp gly 


asp 


phe 


phe 


ala 


pro 


ser 


ala 


pre 




1111/371 
















gag 


ttt cac 


gag 


gag 


aag 


gtc 


gca 


caa 


gaa 


ctg 


glu 


phe his 


glu 


glu 


lys 


val 


ala 


gin 


glu 


leu 



SEQ ID N° 4BD 
FEUILLE DE REM^ggJ/IEjg^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



164/185 



ORF d'apres Cole et al. 
codante Rv0331: 



1998 (Nature 393: 537-544) et contenant la sequence 



1/1 

tga aca ccc gcg ccg acg egg cga 

OPA thr pro ala pro thr arg arg 
61/21 

cca tgg gec gat aat agt ttg act 

pro trp ala asp asn ser leu thr 
121/41 

gcg gcg gaa tct aat att cca aag 

ala ala glu ser asn ile pro lys 
181/61 

age aag acg gtt etc ate ctt ggc 

ser lys thr val leu ile leu gly 
241/81 

cgt caa ctg eta cca cct gag gat 

arg gin leu leu pro pro glu asp 
301/101 

ctg ggc ttg teg ttg eta tgg gtg 

leu gly leu ser leu leu trp val 
361/121 

cgc ccc acc gcg gcg teg ctg ccc 

arg pro thr ala ala ser leu pro 
421/141 

gac ate gcg gee cag gta gtg cac 

asp ile ala ala gin val val his 
481/161 

ate gca tta ggt gcg gcg ctg aac 

ile ala leu gly ala ala leu asn 
541/181 

gee gac gtc gcg ggc cag ttc tac 

ala asp val ala gly gin phe tyr 
601/201 

gag gcg etc gag cat ggc egg ate 

glu ala leu glu his gly arg ile 
661/221 

gec gca ccg ttc gaa gcg gcg ttt 

ala ala pro phe glu ala ala phe 
721/241 

gga acc gta cag ate gac acg ttc 

gly thr val gin ile asp thr phe 
781/261 

gag gtc ggc gag get ttg gtc teg 

glu val gly glu ala leu val ser 
841/281 

aag gec eta get cgc gtc gat gag gec gca 

lys ala leu ala arg val asp glu ala ala 



caa teg 
gin ser 

gac teg 
asp ser 

ata tat 
ile tyr 

gcg ggt 
ala gly 

cga ate 
arg ile 

ttg egg 
leu arg 

ggt gtg 
gly val 

acc gac 
thr asp 

acc gac 
thr asp 

acc ctg 
thr leu 

get gtg 
ala val 

ctg ate 
leu ile 

acg cct 
thr pro 

atg etc 
met leu 



31/11 
egg aaa 
arg lys 
91/31 
gtc agt 
val ser 
151/51 
gga act 
gly thr 
211/71 
gtc ggc 
val gly 
271/91 
ata ttg 
ile leu 
331/111 
ggc tgg 
gly trp 
391/131 
gaa atg 
glu met 
451/151 
aac age 
asn ser 
511/171 
gec gtt 
ala val 
571/191 
gac ggc 
asp gly 
631/211 
get ate 
ala ile 
691/231 
gee gec 
ala ala 
751/251 
gac ccg 
asp pro 
811/271 
aag gat 
lys asp 
871/291 
agg acg 
arg thr 



acc ggt 
thr gly 

cac ccc 
his pro 

cga tgc 
arg cys 

ggc ctg 
gly leu 

gtg gac 
va 1 asp 

egg egg 
arg arg 

gtt act 
val thr 

gtc ate 
val ile 

ccc gga 
pro gly 

gcg get 
ala ala 

gec ggg 
ala gly 

caa etc 
gin leu 

ctg ccg 
leu pro 

cac ggt 
his gly 

atg cac 
met his 



ccg egg gaa 
pro arg glu 

aag acc ttg 
lys thr leu 

gaa gga ate 
glu gly ile 

acc acc gee 
thr thr ala 

agg age ttt 
arg ser phe 

cct gac gac 
pro asp asp 

gca acc gtc 
ala thr val 

ggc tat gac 
gly tyr asp 

ctg teg gac 
leu ser asp 

gag ctg cgt 
glu leu arg 

gtg ccg ttc 
val pro phe 

ggt gac cgc 
gly asp arg 

atg ccc gtt 
met pro val 

gtc ggc ttc 
val gly phe 

ttc ggt gac 
phe gly asp 



tgc tgc ggg 
cys cys gly 

cgc aag act 
arg lys thr 

agg etc atg 
arg leu met 

gac acc etc 
asp thr leu 

gac ggg acg 
asp gly thr 

gtc cgc gtc 
val arg val 

gee cac att 
ala his ile 

gcg ttg gtg 
ala leu val 

gcg etc gac 
ala leu asp 

gcg aag gtc 
ala lys val 

aaa tgc cca 
lys cys pro 

tac gee acc 
tyr ala thr 

gca ggt ccc 
ala gly pro 

cat cct cgc 
his pro arg 

ggc acg tec 
gly thr ser 



SEQ ID N° 48F 
FIGURE 48F 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



165/185 



901/301 
















gaa ccg ttc 
glu pro phe 
961/321 


gat 
asp 


ctg 
leu 


ctt 
leu 


gec 
ala 


gtg 
val 


gtc 
val 


ccc 
pro 


gcg ggt etc 
ala gly leu 
1021/341 


age 
ser 


gaa 
glu 


tec 
ser 


ggg 

gly 


tgg 
trp 


ata 
ile 


ccc 
pro 


gac aac gtg 
asp asn val 
1081/361 


tgg 
trp 


gec 
ala 


ate 
ile 


ggc 
gly 


gat 
asp 


gcg 
ala 


acc 
thr 


ccc aag get 
pro lys ala 
1141/381 


gec 
ala 


gtg 
val 


ttc 
phe 


gee 
ala 


gaa 
glu 


gec 
ala 


cag 
gin 


cat etc ggt 
his leu gly 
1201/401 


tac 
tyr 


gac 
asp 


gta 
val 


get 
ala 


gag 
glu 


cgc 
arg 


cac 
his 


acc ggt gat 
thr gly asp 
1261/421 


cac 
his 


cag 
gin 


gca 
ala 


gec 
ala 


aag 
lys 


ggc 
gly 


gac 
asp 


gtg acg ctg 
val thr leu 
1321/441 


tac 
tyr 


ccg 
pro 


ccg 
pro 


teg 
ser 


egg 
arg 


gag 
glu 


ttt 
phe 


tgg ctg acc 
trp leu thr 


cgc 
arg 


tgg 
trp 


aag 
lys 


acg 
thr 


tga 
OPA 







931/311 
















ccg cac gtg 
pro his val 
991/331 


ccc 
pro 


tec 
ser 


gec 
ala 


gcg 
ala 


gcg 
ala 


egg 
arg 


tea 
ser 


gtg gac ccg 
val asp pro 
1051/351 


cgc 
arg 


acc 
thr 


ctg 
leu 


tec 
ser 


act 
thr 


age 
ser 


gec 
ala 


gtg ctg acg 
val leu thr 
1111/371 


ctg 
leu 


ccg 
pro 


aat 
asn 


ggc 
gly 


aaa 
lys 


ccg 
pro 


ctg 
leu 


gec gca gtt 
ala ala val 
1171/391 


gtc 
val 


gee 
ala 


cac 
his 


ggc 
gly 


gtc 
val 


gec 
ala 


cgc 
arg 


ttc acc ggc 
phe thr gly 
1231/411 


acg 
thr 


ggc 
gly 


gec 
ala 


tgc 
cys 


tac 
tyr 


gtc 
val 


gag 
glu 


ggc gat ttc 
gly asp phe 
1291/431 


ttc 
phe 


get 
ala 


ccg 
pro 


teg 
ser 


gcg 
ala 


ccc 
pro 


teg 
ser 


cac gag gag 
his glu glu 


aag 
lys 


gtc 
val 


gca 
ala 


caa 
gin 


gaa 
glu 


ctg 
leu 


gec 
ala 



SEQ ID N° 48F (suite) 
FIGURE 48F (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



166/185 



Fragment amplifie par PCR d ' apres les similarites de sequences avec une serine 
protease de la famille htrA de E. coli (creation du site BamHI a l'extremite 5» 
et du site SnaBI a l'extremite 3 1 ) et sous-clone dans le vecteur pJVED: 



1/1 


















31/11 


















cca tct 
pro ser 
61/21 


aca 
thr 


ccg 
pro 


etc 
leu 


aac 
asn 


age 
ser 


egg 
arg 


gcc 
ala 


aga 
arg 


cgc tgc 
arg cys 
91/31 


egg 
arg 


teg 
ser 


gtg 
val 


ctg 
leu 


ccg 
pro 


aga 
arg 


agg 
arg 


egg 
arg 


tga tec 
OPA ser 
121/41 


gtg 
val 


gcg 
ala 


agt 
ser 


tgt 
cys 


tea 
ser 


tgt 
cys 


cgc 
arg 


ggc 
gly 


gca cca 
ala pro 
151/51 


ccg 
pro 


ccg 
pro 


acc 
thr 


aac 
asn 


ggg 

gly 


tgc 
cys 


ttg 
leu 


cca 
pro 


tec gtc 
ser val 
181/61 


tga 
OPA 


cca 
pro 


acg 
thr 


gta 
val 


gtt 
val 


cgc 
arg 


tgc 
cys 


tga 
OPA 


tct cca 
ser pro 
211/71 


aaa 
lys 


gtc 
val 


tea 
ser 


age 
ser 


cca 
pro 


ccg 
pro 


aag 
lys 


cag 
gin 


tea tga 
ser OPA 
241/81 


aca 
thr 


age 
ser 


tgc 
cys 


gtt 
val 


ggg 

gly 


tgc 
cys 


tat 
tyr 


tga 
OPA 


teg tgg 
ser trp 
271/91 


gtg 
val 


gga 
gly 


teg 
ser 


ggg 
giy 


tgg 
trp 


egg 
arg 


teg 
ser 


ccg 
pro 


egg tgg 
arg trp 
301/101 


ccg 
pro 


ggg 

gly 


gga 
gly 


tgg 
trp 


tea 
ser 


ccc 
pro 


ggg 

gly 


ccg 
pro 


ggc tga 
gly OPA 
331/111 


ggc 
gly 


egg 
arg 


tgg 
trp 


gcc 
ala 


gcc 
ala 


tea 
ser 


ccg 
pro 


aag 
lys 


egg ccg 
arg pro 
361/121 


age 
ser 


ggg 

gly 


tgg 
trp 


cgc 
arg 


gaa 
glu 


ccg 
pro 


acg 
thr 


acc 
thr 


tgc ggc 
cys gly 
391/131 


cca 
pro 


tec 
ser 


ccg 
pro 


tct 
ser 


teg 
ser 


gca 
ala 


gcg 
ala 


acg 
thr 


aat tgg 
asn trp 
421/141 


cca 
pro 


ggc 
gly 


tga 
OPA 


cag 
gin 


agg 
arg 


cat 
his 


tea 
ser 


att 
ile 


taa tgc 
OCH cys 
451/151 


tgc 
cys 


ggg 

gly 


cgc 
arg 


tgg 
trp 


ccg 
pro 


agt 
ser 


cac 
his 


ggg 
giy 


aac ggc 
asn gly 
481/161 


agg 
arg 


caa 
gin 


ggc 
gly 


tgg 
trp 


tta 
leu 


ccg 
pro 


acg 
thr 


ccg 
pro 


gac atg 
asp met 
511/171 


aat 
asn 


tgc 
cys 


gta 
val 


ccc 
pro 


cgc 
arg 


taa 
OCH 


cgt 
arg 


cgc 
arg 


tgc gca 
cys ala 
541/181 


cca 
pro 


atg 
met 


teg 
ser 


aac 
asn 


tct 
ser 


tga 
OPA 


tgg 
trp 


cct 
pro 


cga tgg 
arg trp 
571/191 


ccc 
pro 


egg 
arg 


ggg 
giy 


etc 
leu 


cgc 
arg 


ggc 
gly 


tac 
tyr 


cca 
pro 


age agg 
ser arg 

601/201 


aga 
arg 


tgg 
trp 


teg 
ser 


ace 
thr 


tgc 
cys 


gtg 
val 


ccg 
pro 


atg 
met 


tgc tgg 
cys trp 
631/211 


etc 
leu 


aaa 

lys 


teg 
ser 


agg 
arg 


aat 
asn 


tgt 
cys 


cca 

pro 


cac 
his 


tgg tag 
trp AMB 
661/221 


gcg 
ala 


att 
ile 


tgg 
trp 


tgg 
trp 


ace 
thr 


tgt 
cys 


ccc 
pro 


gag 
glu 


gcg acg 
ala thr 
691/231 


ccg 
pro 


gag 
glu 


aag 
lys 


tgg 
trp 


tgc 
cys 


acg 
thr 


age 
ser 


egg 
arg 


teg aca 
ser thr 
721/241 


tgg 
trp 


ctg 
leu 


acg 
thr 


teg 
ser 


teg 
ser 


acc 
thr 


gca 
ala 


gcc 
ala 


tgg age 
trp ser 
751/251 


ggg 
giy 


tea 
ser 


ggc 
gly 


ggc 

gly 


ggc 
gly 


gca 
ala 


acg 
thr 


ata 
ile 


tec ttt 
ser phe 
781/261 


teg 
ser 


acg 
thr 


teg 
ser 


agg 
arg 


tga 
OPA 


ttg 
leu 


ggt 

gly 


ggc 

gly 


agg ttt 
arg phe 
811/271 


atg 
met 


gcg 
ala 


ata 
ile 


ccg 
pro 


ctg 
leu 


gat 
asp 


tgt 
cys 


cgc 
arg 


gga tgg 
gly trp 
841/281 


cgc 
arg 


tta 
leu 


ace 
thr 


tga 
OPA 


tgg 
trp 


aca 
thr 


acg 
thr 


ccg 
pro 


cga agt 
arg ser 
371/291 


gga 
gly 


gcc 
ala 


cgc 
arg 


egg 
arg 


gcg 
ala 


gcc 
ala 


acg 
thr 


tgg 
trp 


gtg tea 
val ser 


ggc 

gly 


tga 
OPA 


gcc 
ala 


age 
ser 


teg 
ser 


acg 
thr 


cgt 
arg 


cgc 
arg 


acg ctg 
thr leu 


age 
ser 


tgg 
trp 


tgg 
trp 


ttt 
phe 


ccg 
pro 


acc 
thr 


gcg 
ala 


gcc 
ala 



SEQ ID N° 49A 
FIGURE 4 9A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



167/185 



901/301 








egg gca ttc 


ccg 


tgc 


agg 


arg ala phe 


pro 


cys 


arg 


961/321 








cac ggg cgt 


tgc 


egg 


gtt 


his gly arg 


cys 


arg 


val 


1021/341 








acg gcg gat 


tgc 


tgc 


gca 


thr ala asp 


cys 


cys 


ala 


1081/361 








ttt acg tgc 


tgc 


tec 


ccg 


phe thr cys 


cys 


ser 


pro 


1141/381 








gcg etc gga 


gca 


egg 


aca 


ala leu gly 


ala 


arg 


thr 


1201/401 








etc agt cca 


cgc 


gcg 


caa 


leu ser pro 


arg 


ala 


gin 


1261/421 








cca cgc atg 


gcc 


aag 


ttg 


pro arg met 


ala 


lys 


leu 


1321/441 








atg acg aat 


cac 


cca 


egg 


met thr asn 


his 


pro 


arg 


1381/461 








cag ggg cag 


cag 


caa 


acg 


gin gly gin 


gin 


gin 


thr 


1441/481 








ccg cag cca 


acc 


cag 


tac 


pro gin pro 


thr 


gin 


tyr 


1501/501 








ata cct ggc 


gtg 


att 


ccg 


ile pro gly 


val 


ile 


pro 


1561/521 








gca ggc atg 


ttg 


gcc 


ate 


ala gly met 


leu 


ala 


ile 


1621/541 








gcg gcc gca 


tec 


ctg 


gtc 


ala ala ala 


ser 


leu 


val 


1681/561 








get gcc age 


gcg 


gcg 


cca 


ala ala ser 


ala 


ala 


pro 


1741/581 






gtg gcg gcc 


aag 


gtg 


gtg 


val ala ala 


lys 


val 


val 


1801/601 








gag gag ggc 


tec 


ggc 


ate 


glu glu gly 


ser 


gly 


ile 


1861/621 








ate gcg gcg 


gcc 


gcc 


aag 


lie ala ala 


ala 


ala 


lys 



931/311 

age gcc gtc tgg tgt ttg aac 
ser ala val trp cys leu asn 
991/331 

egg gcc teg ggt tgg cga teg 
arg ala ser gly trp arg ser 

1051/351 
teg aag aca ccg acc cag gcg 
ser lys thr pro thr gin ala 

1111/371 
gcc gtc gga tgc cga ttc cgc 
ala val gly cys arg phe arg 

1171/391 
teg aga act etc ggg gtt egg 
ser arg thr leu gly val arg 

1231/411 
cct agt tgt gca gtt act gtt 
pro ser cys ala val thr val 

1291/431 
gcc cga gta gtg ggc eta gta 
ala arg val val gly leu val 

1351/451 
tat teg cca ccg ccg cag cag 
tyr ser pro pro pro gin gin 

1411/471 
tac age cag cag ttc gac tgg 
tyr ser gin gin phe asp trp 

. 1471/491 
cgt caa ccc tac gag gcg ttg 
arg gin pro tyr glu ala leu 

1531/511 
acc atg acg ccc cct cct ggg 
thr met thr pro pro pro gly 

1591/531 
ggc gcg gtg acg ata gcg gtg 
gly ala val thr ile ala val 

1651/551 
ggg ttc aac egg gca ccc gcc 
gly phe asn arg ala pro ala 

1711/571 
age ate ccc gca gca aac atg 
ser ile pro ala ala asn met 

1771/591 
ccc agt gtc gtc atg ttg gaa 
pro ser val val met leu glu 

1331/611 
att ctg tct gcc gag ggg ctg 
ile leu ser ala glu gly leu 

1891/631 
cct ccc ctg ggc agt ccg ccg 
pro pro leu gly ser pro pro 



ggt ttt acc ggt egg cat egg 
gly phe thr gly arg his arg 

tea aac agg tgg tgc tea acc 
ser asn arg trp cys ser thr 

gcc age ccc ctg gaa cgt cga 
ala ser pro leu glu arg arg 

age ttc ccg gtg cga egg ctg 
ser phe pro val arg arg leu 

cga acg tta tct cag tgg aat 
arg thr leu ser gin trp asn 

gaa age cac acc cat gcc agt 
glu ser his thr his ala ser 

cag gaa gag caa cct age gac 
gin glu glu gin pro ser asp 

ccg gga acc cca ggt tat get 
pro gly thr pro gly tyr ala 

cgt tac cca ccg tec ccg ccc 
arg tyr pro pro ser pro pro 

ggt ggt acc egg ccg ggt ctg 
gly gly thr arg pro gly leu 

atg gtt cgc caa cgc cct cgt 
met val arg gin arg pro arg 

gtg tec gcc ggc ate ggc ggc 
val ser ala gly ile gly gly 

ggc ccc age ggc ggc cca gtg 
gly pro ser gly gly pro val 

ccg ccg ggg teg gtc gaa cag 
pro pro gly ser val glu gin 

acc gat ctg ggc cgc cag teg 
thr asp leu gly arg gin ser 

ate ttg acc aac aac cac gtg 
ile leu thr asn asn his val 

ccg aaa acg acg gta 
pro lys thr thr val 



SEQ ID N° 49A (suite 1) 
FIGURE 49A (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



168/185 



1/1 










cat eta 


cac 


cgc 


tea 


aca 


his leu 


his 


arg 


ser 


thr 


61/21 










gat ccg 


tgg 


cga 


gtt 


gtt 


asp pro 


trp 


arg 


val 


val 


121/41 










ccg tct 


gac 


caa 


egg 


tag 


pro ser 


asp 


gin 


arg 


AMB 


181/61 










cat gaa 


caa 


get 


gcg 


ttg 


his glu 


gin 


ala 


ala 


leu 


241/81 










ggt ggc 


egg 


ggg 


gat 


ggt 


gly gly 


arg 


gly 


asp 


gly 


301/101 










ggc cga 


gcg 


ggt 


ggc 


gcg 


gly arg 


ala 


gly 


gly 


ala 


361/121 










att ggc 


cag 


get 


gac 


aga 


ile gly 


gin 


ala 


asp 


arg 


421/141 










acg gca 


ggc 


aag 


get 


ggt 


thr ala 


gly 


lys 


ala 


gly 


481/161 










gcg cac 


caa 


tgt 


cga 


act 


ala his 


gin 


cys 


arg 


thr 


541/181 










gca gga 


gat 


ggt 


cga 


cct 


ala gly 


asp 


gly 


arg 


pro 


601/201 










ggt agg 


cga 


ttt 


ggt 


gga 


gly arg 


arg 


phe 


gly 


gly 


661/221 










cga cat 


ggc 


tga 


cgt 


cgt 


arg his 


gly 


OPA 


arg 


arg 


721/241 










cct ttt 


cga 


cgt 


cga 


ggt 


pro phe 


arg 


arg 


arg 


gly 


781/261 










gat ggc 


get 


taa 


cct 


gat 


asp gly 


ala 


OCH 


pro 


asp 


841/281 










tgt cag 


get 


gag 


cca 


get 


cys gin 


ala 


glu 


pro 


ala 


901/301 










ggg cat 


tec 


cgt 


gca 


gga 


gly his 


ser 


arg 


ala 


gly 


961/321 










acg ggc 


gtt 


gcc 


ggg 


ttc 


thr gly 


val 


ala 


gly 


phe 


1021/341 








egg egg 


att 


get 


gcg 


ca t 


arg arg 


ile 


ala 


ala 


hi s 











31/11 




gcc 


ggg 


cca 


gac 


get gcc 


ggt 


ala 


gly 


pro 


asp 


ala ala 


gly 










91/31 




cat 


gtc 


gcg 


gcg 


cac cac 


cgc 


his 


val 


ala 


ala 


his his 


arg 










151/51 




ttc 


get 


get 


gat 


etc caa 


aag 


phe 


ala 


ala 


asp 


leu gin 


lys 










211/71 




ggt 


get 


att 


gat 


cgt ggg 


tgg 


gly 


ala 


ile 


asp 


arg gly 


trp 










271/91 




cac 


ccg 


ggc 


egg 


get gag 


gcc 


his 


pro 


gly 


arg 


ala glu 


ala 










331/111 




aac 


cga 


cga 


cct 


gcg gcc 


cat 


asn 


arg 


arg 


pro 


ala ala 


his 










391/131 




ggc 


att 


caa 


ttt 


aat get 


gcg 


gly 


ile 


gin 


phe 


asn ala 


ala 










451/151 




tac 


cga 


cgc 


egg 


aca tga 


att 


tyr 


arg 


arg 


arg 


thr OPA 


ile 










511/171 




ctt 


gat 


ggc 


etc 


gat ggc 


ccc 


leu 


asp 


gly 


leu 


asp gly pro 










571/191 




gcg 


tgc 


cga 


tgt 


get ggc 


tea 


ala 


cys 


arg 


cys 


ala gly 


ser 










631/211 




cct 


gtc 


ccg 


agg 


cga cgc 


egg 


pro 


val 


pro 


arg 


arg arg 


arg 










691/231 




cga 


ccg 


cag 


cct 


gga gcg 


ggt 


arg 


pro 


gin 


pro 


gly ala 


gly 










751/251 




gat 


tgg 


gtg 


gca 


ggt tta 


tgg 


asp 


trp 


val 


ala 


gly leu 


trp 










811/271 




gga 


caa 


cgc 


cgc 


gaa gtg 


gag 


gly 


gin 


arg 


arg 


glu val 


glu 










871/291 




cga 


cgc 


gtc 


gca 


cgc tga 


get 


arg 


arg 


val 


ala 


arg OPA 


ala 










931/311 




gcg 


ccg 


tct 


ggt 


gtt tga 


acg 


ala 


pro 


ser 


gly 


val OPA 


thr 










991/331 




ggg 


cct 


egg 


gtt 


ggc gat 


cgt 


gly 


pro 


arg 


val 


gly asp 


arg 










1051/351 


cga 


aga 


cac 


cga 


ccc agg 


egg 


arg 


arg 


his 


arg 


pro arg 


arg 



egg 
arg 


tgc 
cys 


tgc 
cys 


cga 
arg 


gaa 
glu 


ggc ggt 
gly gly 


cga 
arg 


cca 
pro 


acg 
thr 


ggt 
gly 


get 
ala 


tgc 
cys 


cat 
his 


tct 
ser 


caa 
gin 


gcc 
ala 


cac 
his 


cga 
arg 


age 
ser 


agt 
ser 


gat 
asp 


egg 
arg 


ggt 
gly 


ggc 
gly 


ggt 
gly 


cgc 
arg 


cgc 
arg 


ggt 
gly 


ggg ccg 

gly pro 


cct 
pro 


cac 
his 


cga 
arg 


age 
ser 


ccc 
pro 


cgt 
arg 


ctt 
leu 


egg 
arg 


cag 
gin 


cga 
arg 


cga 
arg 


ggc 
gly 


get 
ala 


ggc 
gly 


cga 
arg 


gtc 
val 


acg 
thr 


gga 
gly 


gcg 
ala 


tac 
tyr 


ccc 
pro 


get 
ala 


aac 
asn 


gtc 
val 


get 
ala 


ggg 

gly 


ggc 
gly 


tec 
ser 


gcg 
ala 


get 
ala 


acc 
thr 


caa 
gin 


aat 
asn 


cga 
arg 


gga 
gly 


att 
ile 


gtc 
val 


cac 
his 


act 
thr 


aga 
arg 


agt 
ser 


ggt 
gly 


gca 
ala 


cga 
arg 


gcc 
ala 


ggt 
gly 


cag 
gin 


gcg 
ala 


gcg 
ala 


gcg 
ala 


caa 
gin 


cga 
arg 


tat 
tyr 


cga 
arg 


tac 
tyr 


cgc 
arg 


tgg 
trp 


att 
ile 


gtc 
val 


gcg 
ala 


ccc 
pro 


gcc 
ala 


ggg 

gly 


egg 
a rQ 


cca 
d ro 


cgt 
arg 


ggg 

gly 


ggt 
gly 


ggt ttc 
gly phe 


cga 
arg 


ccg 
pro 


egg 
arg 


ccc 
pro 


gtt 
val 


tta 
leu 


ccg 
pro 


gtc 
val 


ggc 
gly 


ate 
ile 


ggc 
gly 


caa 
gin 


aca 
thr 


ggt 
gly 


ggt 
gly 


get 
ala 


caa 
gin 


cca 
pro 


cca 
pro 


gcc 
ala 


ccc 
pro 


tgg 
trp 


aac 
asn 


gtc 
val 


gat 
asp 



SEQ ID N° 49B 



FEUILLE DE REMFC»BBMEr4f>P*EGLE 26) 



WO 99/09186 



PCT/FR98/01813 



169/185 



1081/361 






tta cgt get 


get 


ccc 


leu arg ala 


ala 


pro 


1141/381 






cgc teg gag 


cac 


gga 


arg ser glu 


his 


gly 


1201/401 






tea gtc cac 


gcg 


cgc 


ser val his 


ala 


arg 


1261/421 






cac gca tgg 


cca 


agt 


his ala trp 


pro 


ser 


1321/441 






tga cga ate 


ace 


cac 


OPA arg ile 


thr 


his 


1381/461 






agg ggc age 


age 


aaa 


arg gly ser 


ser 


lys 


1441/481 






cgc age caa 


ccc 


agt 


arg ser gin 


pro 


ser 


1501/501 






tac ctg gcg 


tga 


ttc 


tyr leu ala 


OPA phe 


1561/521 






cag gca tgt 


tgg 


cca 


gin ala cys 


trp 


pro 


1621/541 






egg ccg cat 


ccc 


tgg 


arg pro his 


pro 


trp 


1681/561 






ctg cca gcg 


egg 


cgc 


leu pro ala 


arg 


arg 


1741/581 






tgg egg cca 


agg 


tgg 


trp arg pro 


arg 


trp 


1801/601 






agg agg get 


ccg 


gca 


arg arg ala 


pro 


ala 


1861/621 






teg egg egg 


ccg 


cca 


ser arg arg 


pro 


pro 



egg ccg teg gat gee 
arg pro ser asp ala 

cat cga gaa etc teg 
his arg glu leu ser 

aac eta gtt gtg cag 
asn leu val val gin 

tgg ccc gag tag tgg 
trp pro glu AMB trp 

ggt att cgc cac cgc 
gly ile arg his arg 

cgt aca gec age agt 
arg thr ala ser ser 

acc gtc aac cct acg 
thr val asn pro thr 

cga cca tga cgc ccc 
arg pro OPA arg pro 

teg gcg egg tga cga 
ser ala arg OPA arg 

teg ggt tea acc ggg 
ser gly ser thr gly 

caa gca tec ccg cag 
gin ala ser pro gin 

tgc cca gtg teg tea 
cys pro val ser ser 

tea ttc tgt ctg ccg 
ser phe cys leu pro 

age etc ccc tgg gca 
ser leu pro trp ala 



1111/371 

gat tec gca get tec 
asp ser ala ala ser 
1171/391 

ggg ttc ggc gaa cgt 
gly phe gly glu arg 
1231/411 

tta ctg ttg aaa gee 
leu leu leu lys ala 
1291/431 

gec tag tac agg aag 
ala AMB tyr arg lys 
1351/451 

cgc age age egg gaa 
arg ser ser arg glu 
1411/471 

teg act ggc gtt acc 
ser thr gly val thr 
1471/491 

agg cgt tgg gtg gta 
arg arg trp val val 
1531/511 

etc ctg gga tgg ttc 
leu leu gly trp phe 
1591/531 

tag egg tgg tgt ccg 
AMB arg trp cys pro 
1651/551 

cac ccg ccg gec cca 
his pro pro ala pro 
1711/571 

caa aca tgc cgc egg 
gin thr cys arg arg 
1771/591 

tgt tgg aaa ccg ate 
cys trp lys pro ile 
1831/611 

agg ggc tga tct tga 
arg gly OPA ser OPA 
1891/631 

gtc cgc cgc cga aaa 
val arg arg arg lys 



egg tgc gac ggc tgg 
arg cys asp gly trp 

tat etc agt gga ate 
tyr leu ser gly ile 

aca ccc atg cca gtc 
thr pro met pro val 

age aac eta gcg aca 
ser asn leu ala thr 

ccc cag gtt atg etc 
pro gin val met leu 

cac cgt ccc cgc ccc 
his arg pro arg pro 

ccc ggc egg gtc tga 
pro gly arg val OPA 

gec aac gec etc gtg 
ala asn ala leu val 

ccg gca teg gcg gcg 
pro ala ser ala ala 

gcg gcg gee cag tgg 
ala ala ala gin trp 

ggt egg teg aac agg 
gly arg ser asn arg 

tgg gec gec agt egg 
trp ala ala ser arg 

cca aca acc acg tga 
pro thr thr thr OPA 

cga egg ta 
arg arg 



SEQ ID N° 49B (suite 1) 
FIGURE 49B (suite 1) 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



170/185 



1/1 






ate tac 


acc 


get 


ile tyr 


thr 


ala 


61/21 






ate cgt 


ggc 


gag 


ile arg 


gly 


glu 


121/41 






cgt ctg 


acc 


aac 


arg leu 


thr 


asn 


181/61 






atg aac 


aag 


ctg 


met asn 


lys 


leu 


241/81 






gtg gec 


ggg 


ggg 


val ala 


gly 


gly 


301/101 






gec gag 


egg 


gtg 


ala glu 


arg 


val 


361/121 






ttg gec 


agg 


ctg 


leu ala 


arg 


leu 


421/141 






egg cag 


gca 


agg 


arg gin 


ala 


arg 


481/161 






cgc acc 


aat 


gtc 


arg thr 


asn 


val 


541/181 






cag gag 


atg 


gtc 


gin glu 


met 


val 


601/201 






gta ggc 


gat 


ttg 


val gly 


asp 


leu 


661/221 






gac atg 


get 


gac 


asp met 


ala 


asp 


721/241 






ctt ttc 


gac 


gtc 


leu phe 


asp 


val 


781/261 






atg gcg 


ctt 


aac 


met ala 


leu 


asn 


841/281 






gtc agg 


ctg 


age 


val arg 


leu 


ser 


901/301 






ggc att 


ccc 


gtg 


gly ile 


pro 


val 


961/321 






egg gcg 


ttg 


ccg 


arg ala 


leu 


pro 



caa cag ccg ggc 
gin gin pro gly 

ttg ttc atg teg 
leu phe met ser 

ggt agt teg ctg 
gly ser ser leu 

cgt tgg gtg eta 
arg trp val leu 

atg gtc acc egg 
met val thr arg 

gcg cga acc gac 
ala arg thr asp 

aca gag gca ttc 
thr glu ala phe 

ctg gtt acc gac 
leu val thr asp 

gaa etc ttg atg 
glu leu leu met 

gac ctg cgt gec 
asp leu arg ala 

gtg gac ctg tec 
val asp leu ser 

gtc gtc gac cgc 
val val asp arg 

gag gtg att ggg 
glu val ile gly 

ctg atg gac aac 
leu met asp asn 

cag etc gac gcg 
gin leu asp ala 

cag gag cgc cgt 
gin glu arg arg 

ggt teg ggc etc 
gly ser gly leu 



31/11 
cag acg ctg ccg 
gin thr leu pro 

91/31 
egg cgc acc acc 
arg arg thr thr 

151/51 
ctg ate tec aaa 
leu ile ser lys 

211/71 
ttg ate gtg ggt 
leu ile val gly 

271/91 
gee ggg ctg agg 
ala gly leu arg 

331/111 
gac ctg egg ccc 
asp leu arg pro 

391/131 
aat tta atg ctg 
asn leu met leu 

451/151 
gec gga cat gaa 
ala gly his glu 

511/171 
gec teg atg gec 
ala ser met ala 
. 571/191 
gat gtg ctg get 
asp val leu ala 

631/211 
cga ggc gac gee 
arg gly asp ala 

691/231 
age ctg gag egg 
ser leu glu arg 

751/251 
tgg cag gtt tat 
trp gin val tyr 

811/271 
gec gcg aag tgg 
ala ala lys trp 

871/291 
teg cac get gag 
ser his ala glu 

931/311 
ctg gtg ttt gaa 
leu val phe glu 

991/331 
ggg ttg gcg ate 
gly leu ala ile 



gtc ggt get gec 
val gly ala ala 

gee gac caa egg 
ala asp gin arg 

agt etc aag ccc 
ser leu lys pro 

ggg ate ggg gtg 
gly ile gly val 

ccg gtg ggc cgc 
pro val gly arg 

ate ccc gtc ttc 
ile pro val phe 

egg gcg ctg gee 
arg ala leu ala 

ttg cgt acc ccg 
leu arg thr pro 

ccg ggg get ccg 
pro gly ala pro 

caa ate gag gaa 
gin ile glu glu 

gga gaa gtg gtg 
gly glu val val 

gtc agg egg egg 
val arg arg arg 

ggc gat acc get 
gly asp thr ala 

age ccg ccg ggc 
ser pro pro gly 

ctg gtg gtt tec 
leu val val ser 

egg ttt tac egg 
arg phe tyr arg 

gtc aaa cag gtg 
val lys gin val 



gag aag gcg gtg 
glu lys ala val 

gtg ctt gec ate 
val leu ala ile 

acc gaa gca gtc 
thr glu ala val 

gcg gtc gee gcg 
ala val ala ala 

etc acc gaa gcg 
leu thr glu ala 

ggc age gac gaa 
gly ser asp glu 

gag tea egg gaa 
glu ser arg glu 

eta acg teg ctg 
leu thr ser leu 

egg eta ccc aag 
arg leu pro lys 

ttg tec aca ctg 
leu ser thr leu 

cac gag ccg gtc 
his glu pro val 

cgc aac gat ate 
arg asn asp ile 

gga ttg teg egg 
gly leu ser arg 

ggc cac gtg ggt 
gly his val gly 

gac cgc ggc ccg 
asp arg gly pro 

teg gca teg gca 
ser ala ser ala 

gtg etc aac cac 
val leu asn his 
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1021/341 

ggc gga ttg ctg cgc ate gaa gac acc gac 

gly gly leu leu arg ile glu asp thr asp 
1081/361 

tac gtg ctg etc ccc ggc cgt egg atg ccg 

tyr val leu leu pro gly arg arg met pro 
1141/381 

get egg age acg gac ate gag aac tct egg 

ala arg ser thr asp ile glu asn ser arg 
1201/401 

cag tec acg cgc gca acc tag ttg tgc agt 

gin ser thr arg ala thr AMB leu cys ser 
1261/421 

acg cat ggc caa gtt ggc ccg agt agt ggg 

thr his gly gin val gly pro ser ser gly 
1321/441 

gac gaa tea ccc acg gta ttc gcc acc gcc 

asp glu ser pro thr val phe ala thr ala 
1381/461 

ggg gca gca gca aac gta cag cca gca gtt 

gly ala ala ala asn val gin pro ala val 
1441/481 

gca gcc aac cca gta ccg tea acc eta cga 

ala ala asn pro val pro ser thr leu arg 
1501/501 

acc tgg cgt gat tec gac cat gac gcc ccc 

thr trp arg asp ser asp his asp ala pro 
1561/521 

agg cat gtt ggc cat egg cgc ggt gac gat 

arg his val gly his arg arg gly asp asp 
1621/541 

ggc cgc ate cct ggt egg gtt caa ccg ggc 

gly arg ile pro gly arg val gin pro gly 
1681/561 

tgc cag cgc ggc gcc aag cat ccc cgc age 

cys gin arg gly ala lys his pro arg ser 
1741/581 

ggc ggc caa ggt ggt gcc cag tgt cgt cat 

gly gly gin gly gly ala gin cys arg his 
1801/601 

gga ggg etc egg cat cat tct gtc tgc cga 

gly gly leu arg his his ser val cys arg 
1861/621 

cgc ggc ggc cgc caa gcc tec cct ggg cag 

arg gly gly arg gin ala ser pro gly gin 



1051/351 
















cca ggc ggc 
pro gly gly 
1111/371 


cag 
gin 


ccc 
pro 


cct 
pro 


gga 
gly 


acg 
thr 


tea 
ser 


att 
ile 


att ccg cag 
ile pro gin 
1171/391 


ctt 
leu 


ccc 
pro 


ggt 
gly 


gcg 
ala 


acg 
thr 


act 
ala 


aac 
^ 3 

gly 


ggt teg gcg 
gly ser ala 
1231/411 


aac 
asn 


gtt 
val 


ate 
ile 


tea 
ser 


gtg 
val 


gaa 
glu 


tct 
ser 


tac tgt tga 
tyr cys OPA 
1291/431 


aag 
lys 


cca 
pro 


cac 
his 


cca 
pro 


tgc 
cys 


caa 
gin 


tec 
ser 


cct agt aca 
pro ser thr 
1351/451 


gga 

gly 


aga 
arg 


gca 
ala 


acc 
thr 


tag 
AMB 


cga 
arg 


cat 

his 


gca gca gcc 
ala ala ala 
1411/471 


ggg 

gly 


aac 
asn 


ccc 
pro 


agg 
arg 


tta 
leu 


tgc 
cys 


tea 
ser 


cga ctg gcg 
arg leu ala 
1471/491 


tta 
leu 


ccc 
pro 


acc 
thr 


gtc 
val 


ccc 
pro 


gcc 
ala 


ccc 
pro 


ggc gtt ggg 
gly val gly 
1531/511 


tgg 
trp 


tac 
tyr 


ccg 
pro 


gcc 
ala 


ggg 
gly 


tct 
ser 


qat 

<-t W 

asp 


tec tgg gat 
ser trp asp 
1591/531 


ggt 
gly 


teg 
ser 


cca 
pro 


acg 
thr 


ccc 
pro 


tea 
ser 


tac 

3 ^ 

cys 


age ggt ggt 
ser gly gly 
1651/551 


gtc 
val 


cgc 
arg 


egg 
arg 


cat 
his 


egg 
arg 


cqq 

3 3 

arg 


cac 

3 ^ 

arg 


acc cgc egg 
thr arg arg 
1711/571 


ccc 
pro 


cag 
gin 


egg 
arg 


egg 
arg 


ccc 
pro 


agt 
ser 


ggc 
gly 


aaa cat gcc 
lys his ala 
1771/591 


gcc 
ala 


ggg 

gly 


gtc 
val 


ggt 

giy 


cga 
arg 


aca 
thr 


ggt 
gly 


gtt gga aac 
val gly asn 
1831/611 


cga 
arg 


tct 
ser 


ggg 

gly 


ccg 
pro 


cca 
pro 


gtc 
val 


gga 

giy 


ggg get gat 

gly ala asp 
1891/631 


ctt 
leu 


gac 
asp 


caa 
gin 


caa 
gin 


cca 
pro 


cgt 
arg 


gat 
asp 


tec gcc gcc 
ser ala ala 


gaa 
glu 


aac 
asn 


gac 
asp 


ggt 
gly 


a 
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Sequence codante Rv0983 predite par Cole et al . , 1998 (Nature 393: 537-544) et 
contenant seq60A: 



1/1 


















31/11 


















atg gcc 
Met aia 
61/21 


aag 
lys 


ttg 
leu 


gcc 
ala 


cga 
arg 


gta 
val 


gtg 
val 


ggc 
gly 


eta 
leu 


gta cag 
val gin 
91/31 


gaa 
glu 


gag 
glu 


caa 
gin 


cct 
pro 


age 
ser 


gac 
asp 


atg 
met 


acg 
thr 


aat cac 
asn his 
121/41 


cca 
pro 


egg 
arg 


tat 
tyr 


teg 
ser 


cca 
pro 


ccg 
pro 


ccg 
pro 


cag 
gin 


cag ccg 
gin pro 
151/51 


gga 
gly 


acc 
thr 


cca 
pro 


ggt 
gly 


tat 
tyr 


get 
ala 


cag 
gin 


ggg 

gly 


cag cag 
gin gin 
181/61 


caa 
gin 


acg 
thr 


tac 
tyr 


age 

ser 


cag 
gin 


cag 
gin 


ttc 
phe 


gac 
asp 


tgg cgt 
trp arg 
211/71 


tac 
tyr 


cca 
pro 


ccg 
pro 


tec 
ser 


ccg 
pro 


ccc 
pro 


ccg 
pro 


cag 
gin 


cca acc 
pro thr 
241/81 


cag 
gin 


tac 
tyr 


cgt 
arg 


caa 
gin 


ccc 
pro 


tac 
tyr 


gag 
glu 


gcg 
ala 


ttg ggt 
leu gly 
271/91 


ggt 
gly 


acc 
thr 


egg 
arg 


ccg 
pro 


ggt 
gly 


ctg 
leu 


ata 
ile 


cct 
pro 


ggc gtg 
gly val 
301/101 


att 
ile 


ccg 
pro 


acc 
thr 


atg 
met 


acg 
thr 


ccc 
pro 


cct 
pro 


cct 
pro 


ggg atg 
gly met 
331/111 


gtt 
val 


cgc 
arg 


caa 
gin 


cgc 
arg 


cct 
pro 


cgt 
arg 


gca 
ala 


ggc 
gly 


atg ttg 
met leu 
361/121 


gcc 
ala 


ate 
ile 


ggc 
gly 


gcg 
ala 


gtg 
val 


acg 
thr 


ata 
ile 


gcg 
ala 


gtg gtg 
val val 
391/131 


tec 
ser 


gcc 
ala 


ggc 
gly 


ate 
ile 


ggc 
gly 


ggc 
gly 


gcg 
ala 


gcc 
ala 


gca tec 
ala ser 
421/141 


ctg 
leu 


gtc 
val 


ggg 

gly 


ttc 
phe 


aac 
asn 


egg 
arg 


gca 
ala 


ccc 
pro 


gcc ggc 
ala gly 
451/151 


ccc 
pro 


age 
ser 


ggc 
gly 


ggc 
gly 


cca 
pro 


gtg 
val 


get 
ala 


gcc 
ala 


age gcg 
ser ala 
481/161 


gcg 
ala 


cca 
pro 


age 
ser 


ate 
ile 


ccc 
pro 


gca 
ala 


gca 
ala 


aac 
asn 


atg ccg 
met pro 
511/171 


ccg 
pro 


ggg 

gly 


teg 
ser 


gtc 
val 


gaa 
glu 


cag 
gin 


gtg 
val 


gcg 
ala 


gcc aag 
ala lys 
541/181 


gtg 
val 


gtg 
val 


ccc 
pro 


agt 
ser 


gtc 
val 


gtc 
val 


atg 
met 


ttg 
leu 


gaa acc 
glu thr 
571/191 


gat 
asp 


ctg 
leu 


ggc 
gly 


cgc 
arg 


cag 
gin 


teg 
ser 


gag 
glu 


gag 
glu 


ggc tec 
gly ser 
601/201 


ggc 
gly 


'ate 
ile 


att 
ile 


ctg 
leu 


tct 
ser 


gcc 
ala 


gag 
glu 


ggg 

gly 


ctg ate 
leu ile 
631/211 


ttg 
leu 


acc 
thr 


aac 
asn 


aac 
asn 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


gcg gcc 
ala ala 
661/221 


gcc 
ala 


aag 
lys 


cct 
pro 


ccc 
pro 


ctg 
leu 


ggc 
gly 


agt 
ser 


ccg 
pro 


ccg ccg 
pro pro 
691/231 


aaa 
lys 


acg 
thr 


acg 
thr 


gta 
val 


acc 
thr 


ttc 
phe 


tct 
ser 


gac 
asp 


ggg egg 
gly arg 
721/241 


acc 
thr 


gca 
ala 


ccc 
pro 


ttc 
phe 


acg 
thr 


gtg 
val 


gtg 
val 


ggg 

gly 


get gac 
ala asp 
751/251 


ccc 
pro 


acc 
thr 


agt 
ser 


gat 
asp 


ate 
ile 


gcc 
ala 


gtc 
val 


gtc 
val 


cgt gtt 
arg val 
781/261 


cag 
gin 


ggc 

gly 


gtc 

val 


tec 
ser 


ggg 

gly 


etc 
leu 


acc 
thr 


ccg 
pro 


ate tec 
ile ser 
811/271 


ctg 
leu 


ggt 
gly 


tec 
ser 


tec 
ser 


teg 
ser 


gac 
asp 


ctg 
leu 


agg 
arg 


gtc ggt 
val gly 


cag 
gin 


ccg 
pro 


gtg 
val 


ctg 
leu 


gcg 
ala 


ate 
lie 


ggg 

gly 


teg 
ser 


ccg etc 
pro leu 


ggt 

gly 


ttg 
leu 


gag 
glu 


ggc 
gly 


acc 
thr 


gtg 

val 


acc 
thr 


acg 
thr 
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841/281 






ggg ate gtc 


age 


get 


gly ile val 


ser 


ala 


901/301 






acc gtg ctg 


gac 


gec 


thr val leu 


asp 


ala 


961/321 






ctg gtg aac 


atg 


aac 


leu val asn 


met 


asn 


1021/341 






gac tea gee 


gat 


gcg 


asp ser ala 


asp 


ala 


1081/361 






gec aag cgc 


ate 


gec 


ala lys arg 


ile 


ala 


1141/381 






gtg cag gtg 


acc 


aat 


val gin val 


thr 


asn 


1201/401 






ggt get gec 


gcg 


aac 


gly ala ala 


ala 


asn 


1261/421 






ccg ate aac 


age 


gcg 


pro ile asn 


ser 


ala 


1321/441 






gtg gcg eta 


acc 


ttt 


val ala leu 


thr 


phe 


1381/461 




aag gcg gag 


cag 


tga 


lys ala glu 


gin 


OPA 



etc 
leu 


aac 
asn 


cgt 
arg 


cca 
pro 


gtg 
val 


att 
ne 


cag 
gin 


acc 
tnr 


gac 
asp 


gec 
ala 


get 
aia 


caa 
gin 


etc 
leu 


gtc 
va 1 


gga 
gly 


cag 
gin 


age 
ser 


ggc 
gly 


teg 
ser 


ate 
ile 


gac 
asp 


gag 
glu 


ttg 
leu 


ate 
ile 


age 
ser 


gac 
asp 


aaa 
lys 


gac 
asp 


acc 
thr 


ctg 
leu 


get 
ala 


gga gtg 
gly val 


ccg 
pro 


aag 
lys 


gac 
asp 


gcg 
ala 


ttg 
leu 


gtt 
val 


gee 
ala 


cag 
gin 


gat 
asp 


ccc 
pro 


teg 
ser 


ggc 
gly 



871/291 

teg acg acc ggc gag 

ser thr thr gly glu 
931/311 

gcg ate aac ccc ggt 

ala ile asn pro gly 
991/331 

gtc aac teg gec att 

val asn ser ala ile 
1051/351 

ggt etc ggt ttt gcg 

gly leu gly phe ala 
1111/371 

acc ggc aag gcg tea 

thr gly lys ala ser 
1171/391 

ggc gec aag ate gtc 

gly ala lys ile val 
1231/411 

ggc gtc gtt gtc acc 

gly val val val thr 
1291/431 

gec gtg egg tec aaa 

ala val arg ser lys 
1351/451 

ggt age cgc aca gtg 

gly ser arg thr val 



gee ggc aac cag aac 
ala gly asn gin asn 

aac tec ggg ggc gcg 
asn ser gly gly ala 

gee acg ctg ggc gcg 
ala thr leu gly ala 

att cca gtc gac cag 
ile pro val asp gin 

cat gee tec ctg ggt 
his ala ser leu gly 

gaa gta gtg gee ggt 
glu val val ala gly 

aag gtc gac gac cgc 
lys val asp asp arg 

gcg ccg ggc gec acg 
ala pro gly ala thr 

caa gtc acc etc ggc 
gin val thr leu gly 
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ORF d'apres Cole et al . , 1998 (Nature 3 ( 
1/1 

tga gcc age teg acg cgt cgc acg ctg age 
OPA ala ser ser thr arg arg thr leu ser 
61/21 

ccg tgc agg age gcc gtc tgg tgt ttg aac 
pro cys arg ser ala val trp cys leu asn 
121/41 

tgc egg gtt egg gcc teg ggt tgg cga teg 
cys arg val arg ala ser gly trp arg ser 
181/61 

tgc tgc gca teg aag aca ccg acc cag gcg 
cys cys ala ser lys thr pro thr gin ala 
241/81 

tgc tec ccg gcc gtc gga tgc cga ttc cgc 
cys ser pro ala val gly cys arg phe arg 
301/101 

gca egg aca teg aga act etc ggg gtt egg 
ala arg thr ser arg thr leu gly val arg 
361/121 

cgc gcg caa cct agt tgt gca gtt act gtt 
arg ala gin pro ser cys ala val thr val 
421/141 

gcc aag ttg gcc cga gta gtg ggc eta gta 
ala lys leu ala arg val val gly leu val 
481/161 

cac cca egg tat teg cca ccg ccg cag cag 
his pro arg tyr ser pro pro pro gin gin 
541/181 

cag caa acg tac age cag cag ttc gac tgg 
gin gin thr tyr ser gin gin phe asp trp 
601/201 

acc cag tac cgt caa ccc tac gag gcg ttg 
thr gin tyr arg gin pro tyr glu ala leu 
661/221 

gtg att ccg acc atg acg ccc cct cct ggg 
val ile pro thr met thr pro pro pro gly 
721/241 

ttg gcc ate ggc gcg gtg acg ata gcg gtg 
leu ala ile gly ala val thr ile ala val 
781/261 

tec ctg gtc ggg ttc aac egg gca ccc gcc 
ser leu val gly phe asn arg ala pro ala 
841/281 

gcg gcg cca age ate ccc gca gca aac atg 
ala ala pro ser ile pro ala ala asn met 



3:537-544) et contenant Rv0983 
31/11 

tgg tgg ttt ccg acc gcg gcc egg gca ttc 
trp trp phe pro thr ala ala arg ala phe 
91/31 

ggt ttt acc ggt egg cat egg cac ggg cgt 
gly phe thr gly arg his arg his gly arg 
151/51 

tea aac agg tgg tgc tea acc acg gcg gat 
ser asn arg trp cys ser thr thr ala asp 
211/71 

gcc age ccc ctg gaa cgt cga ttt acg tgc 
ala ser pro leu glu arg arg phe thr cys 
271/91 

age ttc ccg gtg cga egg ctg gcg etc gga 
ser phe pro val arg arg leu ala leu gly 
331/111 

cga acg tta tct cag tgg aat etc agt cca 
arg thr leu ser gin trp asn leu ser pro 
391/131 

gaa age cac acc cat gcc agt cca cgc atg 
glu ser his thr his ala ser pro arg met 
451/151 

cag gaa gag caa cct age gac atg acg aat 
gin glu glu gin pro ser asp met thr asn 
511/171 

ccg gga acc cca ggt tat get cag ggg cag 
pro gly thr pro gly tyr ala gin gly gin 
571/191 

cgt tac cca ccg tec ccg ccc ccg cag cca 
arg tyr pro pro ser pro pro pro gin pro 
631/211 

ggt ggt acc egg ccg ggt ctg ata cct ggc 
gly gly thr arg pro gly leu ile oro gly 
691/231 

atg gtt cgc caa cgc cct cgt gca ggc atg 
met val arg gin arg pro arg ala gly met 
751/251 

gtg tec gcc ggc ate ggc ggc gcg gcc gca 
val ser ala gly ile gly gly ala ala ala 
811/271 

ggc ccc age ggc ggc cca gtg get gcc age 
gly pro ser gly gly pro val ala ala ser 
871/291 

ccg ccg ggg teg gtc gaa cag gtg gcg gcc 
pro pro gly ser val glu gin val ala ala 
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901/301 



aag gtg gtg 
lys val val 
961/321 


ccc 
pro 


agt 
ser 


gtc 
val 


gtc 
val 


atg 
met 


ttg 
leu 


gaa 
glu 


tec ggc ate 
ser gly ile 
1021/341 


att 
ile 


ctg 
leu 


tct 
ser 


gcc . 
ala 


gag 
glu 


ggg 
gly 


ctg 
leu 


gcc gcc aag 
ala ala lys 
1081/361 


cct 
pro 


ccc 
pro 


ctg 
leu 


ggc 
gly 


agt 
ser 


ccg 
pro 


ccg 
pro 


egg acc gca 
arg thr ala 
1141/381 


ccc 
pro 


ttc 
phe 


acg 
thr 


gtg 
val 


gtg 
val 


ggg 

gly 


get 
ala 


gtt cag ggc 
val gin gly 
1201/401 


gtc 
val 


tec 
ser 


ggg 

gly 


etc 
leu 


acc 
thr 


ccg 
pro 


ate 
ile 


ggt cag ccg 
gly gin pro 
1261/421 


gtg 
val 


ctg 
leu 


gcg 
ala 


ate 
ile 


ggg 

gly 


teg 
ser 


ccg 
pro 


ate gtc age 
ile val ser 
1321/441 


get 
ala 


etc 
leu 


aac 
asn 


cgt 
arg 


cca 
pro 


gtg 
val 


teg 
ser 


gtg ctg gac 
val leu asp 
1381/461 


gcc 
ala 


att 
ile 


cag 
gin 


acc 
thr 


gac 
asp 


gcc 
ala 


gcg 
ala 


gtg aac atg 
val asn met 
1441/481 


aac 
asn 


get 
ala 


caa 
gin 


etc 
leu 


gtc 
val 


gga gtc 
gly val 


tea gcc gat 
ser ala asp 
1501/501 


gcg 
ala 


cag 
gin 


age 
ser 


ggc 
gly 


teg 
ser 


ate 
ile 


ggt 
gly 


aag cgc ate 
lys arg ile 
1561/521 


gcc 
ala 


gac 
asp 


gag 
glu 


ttg 
leu 


ate 
ile 


age 
ser 


acc 
thr 


cag gtg acc 
gin val thr 
1621/541 


aat 
asn 


gac 
asp 


aaa 
lys 


gac 
asp 


acc 
thr 


ctg ggc 
leu gly 


get gcc gcg 
ala ala ala 
1681/561 


aac 
asn 


get 
ala 


gga 
gly 


gtg 
val 


ccg 
pro 


aag 
lys 


ggc 
gly 


ate aac age 
ile asn ser 
1741/581 


gcg 
ala 


gac 
asp 


gcg 
ala 


ttg 
leu 


gtt 
val 


gcc 
ala 


gcc 
ala 


gcg eta acc 
ala leu thr 


ttt 

phe 


cag 
gin 


gat 
asp 


ccc 
pro 


teg 
ser 


ggc 
gly 


ggt 
gly 



1801/601 
gcg gag cag tga 
ala glu gin OPA 



931/311 
















acc gat ctg 
thr asp leu 
991/331 


ggc 
gly 


cgc 
arg 


cag 
gin 


teg 
ser 


gag 
alu 


gag 
glu 


ggc 

Cf 1 V 


ate ttg acc 
ile leu thr 
1051/351 


aac 
asn 


aac 
asn 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


gcg 
ala 


ccg aaa acg 
pro lys thr 
1111/371 


acg 
thr 


gta 
val 


acc 
thr 


ttc 
phe 


tct 
ser 


gac 
asp 


ggg 

al v 


gac ccc acc 
asp pro thr 
1171/391 


agt 
ser 


gat 
asp 


ate 
ile 


gcc 
ala 


gtc 
val 


gtc 
val 


cgt 
ara 


tec ctg ggt 
ser leu gly 
1231/411 


tec 
ser 


tec 
ser 


teg 
ser 


gac 
asp 


ctg 
leu 


agg 
ara 


gtc 
val 


etc ggt ttg 
leu gly leu 
1291/431 


gag 
glu 


ggc 
gly 


acc 
thr 


gtg 
val 


acc 
thr 


acg 
thr 


ggg 

crl v 


acg acc ggc 
thr thr gly 
1351/451 


gag 
glu 


gcc 
ala 


ggc 
gly 


aac 
asn 


cag 
gin 


aac 
asn 


acc 
thr 


ate aac ccc 
ile asn pro 
1411/471 


ggt 

giy 


aac 
asn 


tec 
ser 


ggg 

gly 


ggc 
gly 


gcg 
ala 


ctg 
leu 


aac teg gcc 
asn ser ala 
1471/491 


att 
ile 


gcc 
ala 


acg 
thr 


ctg 
leu 


ggc 
qly 


gcg 
ala 


gac 
asD 


etc ggt ttt 
leu gly phe 
1531/511 


gcg 
ala 


att 

ile 


cca 
pro 


gtc 
val 


gac 
asp 


cag 
qln 


gcc 
ala 


ggc aag gcg 
gly lys ala 
1591/531 


tea 
ser 


cat 
his 


gcc 
ala 


tec 
ser 


ctg 
leu 


ggt 
gly 


gtg 
val 


gcc aag ate 
ala lys ile 
1651/551 


gtc 
val 


gaa 
glu 


gta 
val 


gtg 
val 


gcc 
ala 


ggt 
gly 


ggt 
gly 


gtc gtt gtc 
val val val 
1711/571 


acc 
thr 


aag 
lys 


gtc 
val 


gac 
asp 


gac 
asp 


cgc 
arg 


ccg 
pro 


gtg egg tec 
val arg ser 
1771/591 


aaa 
lys 


gcg 
ala 


ccg 
pro 


ggc 
gly 


gcc 
ala 


acg 
thr 


gtg 
val 


age cgc aca 
ser arg thr 


gtg 
val 


caa 
gin 


gtc 

val 


acc 
thr 


etc 
leu 


ggc 
gly 


aag 
lys 



SEQ ID N° 49F (suite 1) 
FIGURE 49F (suite 1) 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



176/185 

Fragment amplifie par PGR d'aprea les similarites de sequence avec une serine protease de 
la famille HtrA de E. coli (creation du site SnaBI a 1 ' extremite 3') et sous clone dans 
le vecteur pJVEDa: 

1/1 31/11 

gat ccg gcg ggg egg gtg teg gcg cag gcg tgg ctg gcg gtc acg gcg gtg egg gcg gtg 
asp pro ala gly arg val ser ala gin ala trp leu ala val thr ala val arg ala val 
61/21 91/31 

ccg ccg ggc tgt ggg gcg ccg gcg gcg gcg gtg gca atg gcg gga acg gcg ccg atg cca 
pro pro gly cys gly ala pro ala ala ala val ala met ala gly thr ala pro met pro 
121/41 151/51 

aca teg tea gcg gtg gag acg gtg gec teg gcg gtg ccg gtg gcg gtg gcg gat ggc tct 
thr ser ser ala val glu thr val ala ser ala val pro val ala val ala asp gly ser 
181/61 211/71 

acg gcg acg gcg ggg ccg gcg gac acg gcg gac aag gcg caa teg gee teg gcg gcg gcg 
thr ala thr ala gly pro ala asp thr ala asp lys ala gin ser ala ser ala ala ala 
241/81 271/91 

ccg gcg gcg acg ggg gee agg gcg gcg ccg gec gcg gac tgt ggg gta ctg gcg gcg ccg 
pro ala ala thr gly ala arg ala ala pro ala ala asp cys gly val leu ala ala pro 
301/101 331/111 

gcg gac acg gcg ggc aag gcg gtg gta ccg ggg gec cac cgc tgc ccg gtc agg cag gca 
ala asp thr ala gly lys ala val val pro gly ala his arg cys pro val arg gin ala 
361/121 391/131 

tgg gcg ccg egg gtg gcg ccg gtg ggc tga teg gca acg gcg ggg ccg gcg gcg acg gcg 
trp ala pro arg val ala pro val gly OPA ser ala thr ala gly pro ala ala thr ala 
421/141 451/151 

gtg teg gcg cgt ccg gcg ggg teg ccg gag tag gcg gtg ccg gcg gga acg cca tgc tga 
val ser ala arg pro ala gly ser pro glu AMB ala val pro ala gly thr pro cys OPA 
481/161 511/171 

teg ggc acg gcg gcg ccg gcg gcg ccg gcg gag aca gca gtt teg eta atg gcg egg ccg 
ser gly thr ala ala pro ala ala pro ala glu thr ala val ser leu met ala arg pro 
541/181 571/191 

gcg gcg egg gcg gtg ccg gag ggc acc tct teg gca atg gcg ggt ccg gcg gec acg gcg 
ala ala arg ala val pro glu gly thr ser ser ala met ala gly pro ala ala thr ala 
601/201 631/211 

gag ccg tea egg ccg gca aca ccg gta teg gtg gcg ccg gcg gcg teg gtg ggg acg cca 
glu pro ser arg pro ala thr pro val ser val ala pro ala ala ser val gly thr pro 
661/221 691/231 

ggc tga teg gec acg gtg gcg ccg gcg gtg ccg gcg ggg acc gcg ccg gag cct tgg ttg 
gly OPA ser ala thr val ala pro ala val pro ala gly thr ala pro glu pro trp leu 
721/241 751/251 

gec gtg acg gcg ggc ccg gtg gga acg ggg gcg ctg gcg gec age tat acg gca acg gcg 
ala val thr ala gly pro val gly thr gly ala leu ala ala ser tyr thr ala thr ala 
781/261 811/271 

gcg acg gcg ccc ccg gca ccg gcg gaa cac tgc agg egg egg tga gcg gat tgg tga egg 
ala thr ala pro pro ala pro ala glu his cys arg arg arg OPA ala asp trp OPA arg 
841/281 871/291 

ctt tgt teg gtg cac ccg gec aac ccg gcg aca ccg gee aac ccg get age ccc gat caa 
leu cys ser val his pro ala asn pro ala thr pro ala asn pro ala ser pro asp gin 
901/301 931/311 

cga ggg ttt egg tgc egg tec ggg gca tgg cca tec get gag ctg gcg ate tgg act acg 
arg gly phe arg cys arg ser gly ala trp pro ser ala glu leu ala ile trp thr thr 
961/321 991/331 

ttg gtg tag aaa aat cct gec gec egg acc ctt aag get ggg aca att tct gat age tac 
leu val AMB lys asn pro ala ala arg thr leu lys ala gly thr ile ser asp ser ty- 
1021/341 1051/351 

ccc gac aca gga ggt tac ggg atg age aat teg cgc cgc cgc tea etc agg tgg tea tgg 
pro asp thr gly gly tyr gly met ser asn ser arg arg arg ser leu arg tro ser tro 
1081/361 1111/371 

ttg ctg age gtg ctg get gec gtc ggg ctg ggc ctg gec acg gcg ccg gec cag gcg gec 
leu leu ser val leu ala ala val gly leu gly leu ala thr ala pro ala gin ala ala 
1141/381 

ccg ccg gec ttg teg cag gac egg tt 
pro pro ala leu ser gin asp arg 

SEQ ID N° 50A 



FEUILLE DE REMP|-^^E^|REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



177/185 



1/1 








ate egg 


caa 


aac 


aaa 
yyy 


ile arg 


arg 


yxy 


y 1 y 


61/21 








coc cao 


get 


at a 


aaa 


a r rt a 

uJuU u 1, U 


ala 


val 


gly 


121/41 








cat cgt 


cag 


caa 


taa 


his arg 


gin 


arg 




181/61 








egg cga 


egg 


egg 


ggc 


arg arg 


arg 


arg 


ct 1 V 

yxy 


241/81 








CQQ CQQ 


cga 


caa 


aaa 
yyy 


arg arg 


arg 


arg 


yxy 


301/101 








egg aca 


caa 
y y 


caa 


aca 


arg thr 


arg 


arg 


ala 


361/121 








ggg cgc 


cgc 


aaa 


taa 
w yy 


alv ara 


ara 

ti J. VJ 


al v 
y j 


tro 


421/141 








tgt egg 


cgc 


gtc 


egg 


cvs arc 
j y 


arg 


va 1 


arg 


481/161 








egg gca 


egg 


egg 


cgc 


arg ala 


ara 


arg 


arg 


541/181 








egg cgc 


ggg 


egg 


tgc 


ara ara 


al v 


arg 


CVS 


601/201 








age cgt 


cac 


fine 
yy^. 






his 


gly 


arg 


661/221 








get gat 


egg 


cca 


egg 


Ala a in 


arg 


pro 


arg 


721/241 








ccg tga 


Cera 


can 


gee 


pro OP A 




arg 


ala 


781/261 








cga egg 


cgc 


ccc 


coo 

*-y y 


arg arg 


arg 


pro 


arg 


841/281 








ttt gtt 


egg 


tgc 


acc 


phe val 


arg 


CVS 


thr 


901/301 








gag ggt 


ttc 


aat 
yy u 


gee 


glu gly 


phe 


gly 


ala 


961/321 








tgg tgt 


aga 


aaa 


ate 


trp cy3 


arg 


lys 


ile 


1021/341 






ccg aca 


cag 


gag 


gtt 


pro thr 


gin 


glu 


val 


1031/361 






tgc tga 


gcg 


tgc 


tgg 


cys OPA 


ala 


cys 


trp 


1141/38 


L 






cgc egg 


cct 


tgt 


cgc 


arg arg 


pro 


cy5 


arg 



tgt egg cgc agg cgt 
cy3 arg arg arg arg 

cgc egg egg egg egg 
arg arg arg arg arg 

aga egg tgg cct egg 
arg arg trp pro arg 

egg egg aca egg egg 
arg arg thr arg arg 

cca ggg egg cgc egg 
pro gly arg arg arg 

agg egg tgg tac egg 
arg arg trp tyr arg 

cgc egg tgg get gat 
arg arg trp ala asp 

egg ggt cgc egg agt 
arg gly arg arg ser 

egg egg cgc egg egg 
arg arg arg arg arg 

egg agg gca cct ctt 
arg arg ala pro leu 

caa cac egg tat egg 
gin his arg tyr arg 

tgg cgc egg egg tgc 
trp arg arg arg cys 

egg tgg gaa egg ggg 
arg trp glu arg gly 

cac egg egg aac act 
his arg arg asn thr 

egg cca acc egg cga 
arg pro thr arg arg 

ggt ccg ggg cat ggc 
gly pro gly his gly 

ctg ccg ccc gga ccc 
leu pro pro gly pro 

acg gga tga gca att 
thr gly OPA ala ile 

ctg ccg teg ggc tgg 
leu pro ser gly trp 

agg acc ggt t 
arg thr gly 



ji / ii 








ggc tgg 


egg 


tea 


egg 


gly trp 


arg 


ser 


arg 










tgg caa 


tgg 


egg 


gaa 


trp gin 


trp 


arg 


glu 


ID J./01 








yy ^y*- 


egg 


tgg 


egg 


arg cys 


arg 


trp 


arg 


£11/ / 1 








aca a nn 


cgc 


aat 


egg 


thr arg 


arg 


asn 


arg 


c 1 1/ y i 








ctg egg 


ac t 


gtg 


ggg 


pro arg 


tnr 


val 


gly 


jJi / in 








ggg ccc 


acc 


get 


gee 


gly pro 


Car 


ala 


ala 


TQ1 / 1 ^) 1 








can rap 


egg 


egg 


ggc 


arg gin 


arg 


arg 


gly 


451/151 








aaa ccra 
°yy L yy 


t c 
gc 


egg 


egg 


arg arg 


cys 


arg 


arg 


J 1 1/ 1 IX 








aga cag 


cag 


ttt 


cgc 


arg gin 


gin 


phe 


arg 


^71 /1Q1 
J / 1 / 1 j 1 








egg caa 


tgg 


egg 


gtc 


arg gin 


trp 


arg 


val 


CI 1/111 
DJ 1/ £11 








tgg cgc 


egg 


egg 


cgt 


trp arg 


arg 


arg 


arg 


by 1/z Jl 








egg egg 


gga 


ccg 


cgc 


arg arg 


gly 


pro 


arg 


~i £ 1 /TCI 

to 1 / Z 0 1 








cgc tgg 


egg 


cca 


gc t 


arg trp 


arg 


pro 


ala 


811/271 








gca ggc 


ggc 


ggt 


gag 


ala gly 


gly 


gly 


glu 


871/291 








cac egg 


cca 


acc 


egg 


his arg 


pro 


thr 


arg 


931/311 








cat ccg 


ctg 


age 


tgg 


his pro 


leu 


ser 


trp 


991/331 








tta agg 


ctg 


gga 


caa 


leu arg 


leu 


gly 


gin 


1051/351 






cgc gec 


gec 


get 


cac 


arg ala 


al a 


ala 


hi s 


1111/371 






gec tgg 


cca 


egg 


cgc 


ala trp 


pro 


arg 


arg 



egg tgc ggg egg tgc 
arg cys gly arg cys 

egg cgc cga tgc caa 
arg arg arg cys gin 

tgg egg atg get eta 
trp arg met ala leu 

cct egg egg egg cgc 
pro arg arg arg arg 

tac tgg egg cgc egg 
tyr trp arg arg arg 

egg tea ggc agg cat 
arg ser gly arg his 

egg egg cga egg egg 
arg arg arg arg arg 

gaa cgc cat get gat 
glu arg his ala asp 

taa tgg cgc ggc egg 
OCH trp arg gly arg 

egg egg cca egg egg 
arg arg pro arg arg 

egg tgg gga cgc cag 
arg trp gly arg gin 

egg age ctt ggt tgg 
arg ser leu gly trp 

ata egg caa egg egg 
ile arg gin arg arg 

egg att ggt gac ggc 
arg lie gly asp gly 

eta gec ccg ate aac 
leu ala pro ile asn 

cga tct gga eta cgt 
arg ser gly leu arg 

ttt ctg ata get acc 
phe leu ile ala thr 

tea ggt ggt cat ggt 
ser gly gly his gly 

egg ccc agg egg ccc 
arg pro arg arg pro 



SEQ ID N° SOB 



FIGURE 50B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



178/185 



l/i 31/11 

tec ggc ggg gcg ggt gtc ggc gca ggc gtg get ggc ggt cac ggc ggt gcg ggc ggt gec 
ser gly gly ala gly val gly ala gly val ala gly gly hia gly gly ala gly gly ala 
61/21 91/31 

gec ggg ctg tgg ggc gec ggc ggc ggc ggt ggc' aat ggc ggg aac ggc gec gat gec aac 
ala gly leu trp gly ala gly gly gly gly gly asn gly gly asn gly ala asp ala asn 
121/41 151/51 

ate gtc age ggt gga gac ggt ggc etc ggc ggt gec ggt ggc ggt ggc gga tgg etc tac 
ile val aer gly gly asp gly gly leu gly gly ala gly gly gly gly gly trp leu tyr 
181/61 211/71 

ggc gac ggc ggg gee ggc gga cac ggc gga caa ggc gca ate ggc etc ggc ggc ggc gee 
gly asp gly gly ala gly gly hia gly gly gin gly ala ile gly leu gly gly gly ala 
241/81 271/91 

ggc ggc gac ggg ggc cag ggc ggc gec ggc cgc gga ctg tgg ggt act ggc ggc gec ggc 
gly gly asp gly gly gin gly gly ala gly arg gly leu trp gly thr gly gly ala gly 
301/101 331/111 

gga cac ggc ggg caa ggc ggt ggt ace ggg ggc cca ccg ctg ccc ggt cag gca ggc atg 
gly hia gly gly gin gly gly gly thr gly gly pro pro leu pro gly gin ala gly met 
361/121 391/131 

ggc gee gcg ggt ggc gee ggt ggg ctg ate ggc aac ggc ggg gec ggc ggc gac ggc ggt 
gly ala ala gly gly ala gly gly leu ile gly asn gly gly ala gly gly asp gly gly 
421/141 451/151 

gtc ggc gcg tec ggc ggg gtc gee gga gta ggc ggt gec ggc ggg aac gec atg ctg ate 
val gly ala ser gly gly val ala gly val gly gly ala gly gly asn ala met leu ile 
481/161 511/171 

ggg cac ggc ggc gee ggc ggc gee ggc gga gac age agt ttc get aat ggc gcg gec ggc 
gly his gly gly ala gly gly ala gly gly aap ser aer phe ala asn gly ala ala gly 
541/181 571/191 

ggc gcg ggc ggt gec gga ggg cac etc ttc ggc aat ggc ggg tec ggc ggc cac ggc gga 
gly ala gly gly ala gly gly hia leu phe gly asn gly gly ser gly gly hia gly gly 
601/201 631/211 

gec gtc acg gec ggc aac ace ggt ate ggt ggc gec ggc ggc gtc ggt ggg gac gec agg 
ala val thr ala gly asn thr gly ile gly gly ala gly gly val gly gly asp ala arg 
661/221 691/231 

ctg ate ggc cac ggt ggc gee ggc ggt gec ggc ggg gac cgc gec gga gec ttg gtt ggc 
leu ile gly his gly gly ala gly gly ala gly gly asp arg ala glv ala leu val gly 
721/241 751/251 

cgt gac ggc ggg ccc ggt ggg aac ggg ggc get ggc ggc cag eta tac ggc aac ggc ggc 
arg asp gly gly pro gly gly asn gly gly ala gly gly gin leu tyr gly aan gly glv 
781/261 811/271 

gac ggc gec ccc ggc acc ggc gga aca ctg cag gcg gcg gtg age gga ttg gtg acg get 
aap gly ala pro gly thr gly gly thr leu gin ala ala val ser gly leu val thr ala 
841/281 871/291 

ttg ttc ggt gca ccc ggc caa ccc ggc gac acc ggc caa ccc ggc tag ccc cga tea acg 
leu phe gly ala pro gly gin pro gly asp thr gly gin pro gly AMB pro arg aer thr 
901/301 931/311 

agg gtt teg gtg ccg gtc egg ggc atg gec ate cgc tga get ggc gat ctg gac tac gtt 
arg val ser val pro val arg gly met ala ile arg OPA ala gly asp leu a3p tyr val 
961/321 991/331 

ggt gta gaa aaa tec tgc cgc ccg gac cct taa ggc tgg gac aat ttc tga tag eta ccc 
gly val glu lys ser cys arg pro asp pro OCH gly trp asp asn phe OPA AMB leu pro 
1021/341 1051/351 

cga cac agg agg tta egg gat gag caa ttc gcg ccg ccg etc act cag gtg gtc atg gtt 
arg his arg arg leu arg asp glu gin phe ala pro pro leu thr gin val val met val 
1081/361 1111/371 

get gag cgt get ggc tgc cgt egg get ggg cct ggc cac ggc gec ggc cca ggc ggc ccc 
ala glu arg ala gly cys arg arg ala gly pro gly his gly ala gly pro gly gly pro 
1141/381 

gec ggc ctt gtc gca gga ccg gtt 
ala gly leu val ala gly pro val 



SEQ ID N° 50C 



FIGURE 50C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



179/185 



Sequence codante Rv0l25 predite par Cole et al . , 1998 {Nature 393:537-544) 
contenant seq50A: 



1/1 


















31/11 


















atg age 
Met ser 
61/21 


aat 
asn 


teg 
ser 


cgc 
arg 


cgc 
arg 


cgc 
arg 


tea 
ser 


etc 
leu 


agg 
arg 


tgg tea 
trp ser 
91/31 


tgg 
trp 


ttg 
leu 


ctg 
leu 


age 
ser 


gtg 
val 


ctg 
leu 


get 
ala 


gcc 
ala 


gtc ggg 
val gly 
121/41 


ctg 
leu 


ggc 
gly 


ctg 
leu 


gcc 
ala 


acg 
thr 


gcg 
ala 


ccg 
pro 


gcc 
ala 


cag gcg 
gin ala 
151/51 


gcc 
ala 


ccg 
pro 


ccg 
pro 


gcc 
ala 


ttg 
leu 


teg 
ser 


cag 
gin 


gac 
asp 


egg ttc 
arg phe 
181/61 


gcc 
ala 


gac 
asp 


ttc 
phe 


ccc 
pro 


gcg 
ala 


ctg 
leu 


ccc 
pro 


etc 
leu 


gac ccg 
asp pro 
211/71 


tec 
ser 


gcg 
ala 


atg 
met 


gtc 
val 


gcc 
ala 


caa 
gin 


gtg 
val 


ggg 

gly 


cca cag 
pro gin 
241/81 


gtg 

val 


gtc 
val 


aac 
asn 


ate 
ile 


aac 
asn 


acc 
thr 


aaa 
lys 


ctg 
leu 


ggc tac 
gly tyr 
271/91 


aac 
asn 


aac 
asn 


gcc 
ala 


gtg 
val 


ggc 
gly 


gcc 
ala 


ggg 

gly 


acc 
thr 


ggc ate 
gly ile 
301/101 


gtc 
val 


ate 
ile 


gat 
asp 


ccc 
pro 


aac 
asn 


ggt 
gly 


gtc 
val 


gtg 
val 


ctg acc 
leu thr 
331/111 


aac 
asn 


aac 
asn 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


ggc 
gly 


gcc 
ala 


acc gac 
thr asp 
361/121 


ate 
ile 


aat 
asn 


gcg 
ala 


ttc 
phe 


age 
ser 


gtc 
val 


ggc 
gly 


tec 
ser 


ggc caa 
gly gin 
391/131 


acc 
thr 


tac 
tyr 


ggc 
gly 


gtc 
val 


gat 
asp 


gtg 
val 


gtc 
val 


ggg 

gly 


tat gac 
tyr asp 
421/141 


cgc 
arg 


acc 
thr 


cag 
gin 


gat 
asp 


gtc 
val 


gcg 
ala 


gtg 
val 


ctg 
leu 


cag ctg 
gin leu 
451/151 


cgc 
arg 


ggt 
gly 


gcc 
ala 


ggt 
gly 


ggc 
gly 


ctg 
leu 


ccg 
pro 


teg 
ser 


gcg gcg 
ala ala 
481/161 


ate 
ile 


ggt 
gly 


ggc 
gly 


ggc 
gly 


gtc 
val 


gcg 
ala 


gtt 
val 


ggt 
gly 


gag ccc 
glu pro 
511/171 


gtc 
val 


gtc 
val 


gcg 
ala 


atg 
met 


ggc 
gly 


aac 
asn 


age 
ser 


ggt 
gly 


ggg cag 
gly gin 
541/181 


ggc 
gly 


gga 
gly 


acg 
thr 


ccc 
pro 


cgt 
arg 


gcg 
ala 


gtg 
val 


cct 
pro 


ggc agg 
gly arg 
571/191 


gtg 
val 


gtc 
val 


gcg 
ala 


etc 
leu 


ggc 
gly 


caa 
gin 


acc 
thr 


gtg 
val 


cag gcg 
gin ala 
601/201 


teg 
ser 


gat 
asp 


teg 
ser 


ctg 
leu 


acc 
thr 


ggt 
gly 


gcc 
ala 


gaa 
glu 


gag aca 
glu thr 
631/211 


ttg 

leu 


aac 
asn 


ggg 

gly 


ttg 
leu 


ate 
ile 


cag 
gin 


ttc 
phe 


gat 
asp 


gcc gcg 
ala ala 
661/221 


ate 
ile 


cag 
gin 


ccc 
pro 


ggt 
gly 


gat 
asp 


teg 
ser 


ggc 
gly 


ggg 

gly 


ccc gtc 
pro val 
691/231 


gtc 
val 


aac 
asn 


ggc 
gly 


eta 
leu 


gga 
gly 


cag 
gin 


gtg 
val 


gtc 
val 


ggt atg 
gly met 
721/241 


aac 
asn 


acg 
thr 


gcc 
ala 


gcg 
ala 


tec 
ser 


gat 
asp 


aac 
asn 


ttc 
phe 


cag ctg 
gin leu 
751/251 


tec 
ser 


cag 
gin 


ggt 
gly 


ggg 

gly 


cag 
gin 


gga 
gly 


ttc 
phe 


gcc 
ala 


att ccg 
ile pro 
781/261 


ate 
ile 


ggg 

gly 


cag 
gin 


gcg 
ala 


atg 
met 


gcg 
ala 


ate 
ile 


gcg 
ala 


ggc cag 
gly gin 
811/271 


ate 
ile 


cga 
arg 


teg 
ser 


ggt 
gly 


ggg 

gly 


ggg 

gly 


tea 
ser 


ccc 
pro 


acc gtt 
thr val 
841/281 


cat 
his 


ate 
ile 


ggg 

gly 


cct 
pro 


acc 
thr 


gcc 
ala 


ttc 
phe 


etc 
leu 


ggc ttg 
gly leu 
871/291 


ggt 
gly 


gtt 
val 


gtc 
val 


gac 
asp 


aac 
asn 


aac 
asn 


ggc 
gly 


aac 
asn 


ggc gca 
gly ala 
901/301 


cga 
arg 


gtc 
val 


caa 
gin 


cgc 
arg 


gtg 
val 


gtc 
val 


ggg 

gly 


age 
ser 


get ccg 
ala pro 
931/311 


gcg 
ala 


gca 
ala 


agt 
ser 


etc 
leu 


ggc 
gly 


ate 
ile 


tec 
ser 


acc 
thr 


ggc gac 
gly asp 
961/321 


gtg 
val 


ate 
ile 


acc 
thr 


gcg 
ala 


gtc 
val 


gac 
asp 


ggc 
gly 


get 
ala 


ccg ate 
pro ile 
991/331 


aac 
asn 


teg 
ser 


gcc 
ala 


acc 
thr 


gcg 
ala 


atg 
met 


gcg 
ala 


gac 
asp 


gcg etc aac 
ala leu asn 
1021/341 


ggg 

gly 


cat 
his 


cat 
his 


ccc 
pro 


ggt 
gly 


gac 
asp 


gtc 
val 


ate teg gtg 
ile ser val 
1051/351 


acc 
thr 


tgg 
trp 


caa 
gin 


acc 
thr 


aag 
lys 


teg 
ser 


ggc 
gly 


ggc acg 
gly thr 


cgt 
arg 


aca 
thr 


ggg 

gly 


aac 
asn 


gtg 
val 


aca 
thr 


ttg 
leu 


gcc 
ala 


gag gga 
glu gly 


ccc 
pro 


ccg 
pro 


gcc 
ala 


tga 
OPA 











SEQ ID N° 50D 



FEUILLE DE REMPHACEKIE5fTC(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



180/185 



ORF d'apres Cole et al . , 1998 (Nature 393:537-544) et contenant Rv0125: 



1/1 








tag aaa 


aat 


cct 


gcc 


AMB lys 


asn 


pro 


ala 


61/21 








aca gga 


ggt 


tac 


ggg 


thr gly gly 


tyr 


gly 


121/41 








age gtg 


ctg 


get 


gcc 


ser val 


leu 


ala 


ala 


181/61 








gcc ttg 


teg 


cag 


gac 


ala leu 


ser 


gin 


asp 


241/81 








gtc gcc 


caa 


gtg 


ggg 


val al a 


gin 


val 


gly 


301/101 








gtg ggc 


gcc 


ggg 


acc 


val gly ala 


gly 


thr 


361/121 








gtg ate 


gcg 


ggc 


gcc 


val ile 


ala 


gly 


ala 


421/141 








gtc gat 


gtg 


gtc 


ggg 


val asp 


val 


val 


gly 


481/161 








ggt ggc 


ctg 


ccg 


teg 


gly gly 


leu 


pro 


ser 


541/181 








atg ggc 


aac 


age 


ggt 


met gly 


asn 


ser 


gly 


601/201 








etc ggc 


caa 


acc 


gtg 


leu gly gin 


thr 


val 


661/221 








ttg ate 


cag 


ttc 


gat 


leu ile 


gin 


phe 


asp 


721/241 








eta gga 


cag 


gtg 


gtc 


leu gly gin 


val 


val 


781/261 








ggg cag 


gga 


ttc 


gcc 


gly gin gly 


phe 


ala 


841/281 








ggt ggg 


ggg 


tea 


ccc 


gly gly 


gly 


ser 


pro 


901/301 








gac aac 


aac 


ggc 


aac 


asp asn 


asn 


gly 


asn 


961/321 








etc ggc 


ate 


tec 


acc 


leu gly 


ile 


ser 


thr 


1021/341 






acc gcg 


atg 


gcg 


gac 


thr ala 


met 


ala 


asp 


1081/361 






caa acc 


aag 


teg 


ggc 


gin thr 


lys 


ser 


gly 


1141/38 


1 






tga 








OPA 









gcc egg acc ctt aag 
ala arg thr leu lys 

atg age aat teg cgc 
met ser asn ser arg 

gtc ggg ctg ggc ctg 
val gly leu gly leu 

egg ttc gcc gac ttc 
arg phe ala asp phe 

cca cag gtg gtc aac 
pro gin val val asn 

ggc ate gtc ate gat 
gly ile val ile asp 

acc gac ate aat gcg 
thr asp ile asn ala 

tat gac cgc acc cag 
tyr asp arg thr gin 

gcg gcg ate ggt ggc 
ala ala ile gly gly 

ggg cag ggc gga acg 
gly gin gly gly thr 

cag gcg teg gat teg 
gin ala ser asp ser 

gcc gcg ate cag ccc 
ala ala ile gin pro 

ggt atg aac acg gcc 
gly met asn thr ala 

att ccg ate ggg cag 
ile pro ile gly gin 

acc gtt cat ate ggg 
thr val his ile gly 

ggc gca cga gtc caa 
gly ala arg val gin 

ggc gac gtg ate acc 
gly asp val lie thr 

gcg ctt aac ggg cat 
ala leu asn gly his 

ggc acg cgt aca ggg 
gly thr arg thr gly 



31/11 








act aaa 


aca 


att 


tct 


ala alv 


thr 


ile 


ser 


91/31 








cac cac 


tea 


etc 


Ann 


arg arg 


ser 


leu 


arg 


151/51 








acc aca 


gcg 


ccg 


gcc 


ala thr 


ala 


pro 


al a 


211/71 








ccc gcg 


ctg 


ccc 


etc 


pro ala 


leu 


pro 


leu 


271/91 








ate aac 


acc 


aaa 


ctg 


ile asn 


thr 


lys 


leu 


331/111 








ccc aac 


ggt 


gtc 


gtg 


pro asn 


gly val 


val 


391/131 








ttc age 


gtc 


aac 
y y ^ 


tec 


phe ser 


val 


al v 


ser 


451/151 








gat gtc 


gcg 


ata 


ctg 


asp val 


ala 


val 


leu 


511/171 








ggc gtc 


gcg 


att 


aat 


gly val 


ala 


val 


al v 


571/191 








ccc cgt 


gcg 


gtg 


cct 


pro arg 


ala 


val 


pro 


631/211 








ctg acc 


ggt 


gcc 


gaa 


leu thr 


gly 


ala 


glu 


691/231 








ggt gat 


teg 


ggc 


yy y 


gly asp 


ser 


gly 


y x y 


751/251 








gcg tec 


gat 


aac 


ttc 


ala ser 


asp 


asn 


phe 


811/271 








gcg atg 


gcg 


ate 


qca 


ala met 


ala 


ile 


al a 


871/291 








cct acc 


gcc 


ttc 


etc 


pro thr 


ala 


phe 


leu 


931/311 








cgc gtg 


gtc 


ggg 


age 


arg val 


val 


gly 


ser 


991/331 








gcg gtc 


gac 


ggc 


get 


ala val 


asp 


gly 


ala 


1051/351 






cat ccc 


ggt 


gac 


gtc 


his pro 


gly 


asp 


val 


1111/371 






aac gtg 


aca 


ttg 


gcc 


asn val 


thr 


leu 


ala 



gat age tac ccc gac 
a3p ser tyr pro asp 

tgg tea tgg ttg ctg 
trp ser trp leu leu 

cag gcg gcc ccg ccg 
gin ala ala pro pro 

gac ccg tec gcg atg 
a3p pro ser ala met 

ggc tac aac aac gcc 
gly tyr asn asn ala 

ctg acc aac aac cac 
leu thr asn asn his 

ggc caa acc tac ggc 
gly gin thr tyr gly 

cag ctg cgc ggt gcc 
gin leu arg gly ala 

gag ccc gtc gtc gcg 
glu pro val val ala 

ggc agg gtg gtc gcg 
gly arg val val ala 

gag aca ttg aac ggg 
glu thr leu asn gly 

ccc gtc gtc aac ggc 
pro val val asn gly 

cag ctg tec cag ggt 
gin leu ser gin gly 

ggc cag ate cga teg 
gly gin ile arg 3er 

ggc ttg ggt gtt gtc 
gly leu gly val val 

get ccg gcg gca agt 
ala pro ala ala ser 

ccg ate aac teg gcc 
pro ile asn ser ala 

ate teg gtg acc tgg 
ile ser val thr trp 

gag gga ccc ccg gcc 
glu gly pro pro ala 
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FIGURE 51A 



phoA 



stop 



RBS 



luc 



QGCTCTGGGGCTCAAAfA^ 



Ps 1 1 



FIGURE 51B 
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Experiences d T hybridation moleculaire d'une sonde specif ique 
du DP428 sur 1 1 ADN genomique de differentes espdces de 
mycobacteries 



1 2 3 4 56 7 8 9 10111213 




1: M. tuberculosis 2: M. bovis 3: BCG 4: M. africanum 5: cancelled 
fortuitum 7: M. simiae 8: M. avium 9: M. chelonae 10: M. flavescens 1 
gordonae 12: M. marinum 13: M. kansasii 
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C terminus 




RR 
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(57) Abstract 



The invention concerns recombinant vectors replicated in mycobacteria, a set of sequences coding for exported polypeptides detected 
by fusion with alkaline phosphatase, in particular one polypeptide, called DP428, of about 12 kD corresponding to an exported protein found 
in mycobacteria belonging to the Mycobacterium tuberculosis complex. The invention also concerns methods and kits for detecting in vitro 
the presence of a mycobacterium and in particular a mycobacterium belonging to the Mycobacterium tuberculosis complex in a biological 
sample using said polypeptides, their fragments or polynucleotides coding for the latter. The invention also concerns immunogenic or 
vaccine compositions for preventing and/or treating infections caused by mycobacteria and in particular a mycobacterium belonging to said 
complex, particularly tuberculosis. 



(57) Abrege- 

L'invention a pour objet des vecteurs recombinants se replicant chez les mycobacteiies, un ensemble de sequences codant pour 
des polypeptides exportgs d6tectes par des fusions avec la phosphatase alcaline, notammcnt un polypeptide, denomme* DP428, d* environ 
12kD correspondant a une proline exportee retrouvee dans les mycobact6ries appartenant au complexe de Mycobacterium tuberculosis, 
V invention concerne dgalemcnt des precedes et des kits de detection in vitro de la presence d'une mycobacterie et en particulier une 
mycobacterie appartenant au complexe de Mycobacterium tuberculosis dans un echantillon biologique utilisant lesdits polypeptides, leurs 
fragments ou des polynucleotides codant pour ces derniers. L* invention vise des compositions immunogenes ou vaccins pour la prevention 
et/ou le traitement defections provoquees par des mycobact£ries et en particulier une mycobacterie appartenant audit complexe, en 
particulier la tuberculose. 
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using a plasmid shuttle vector" 
JOURNAL OF BACTERIOLOGY, 
vol. 175, no. 16, August 1993, pages 
5186-5192, XPG02063437 
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Box I Observations where certain claims were found unsearchable (Continuation of item 1 of first sheet) 

This international search report has not been established in respect of certain claims under Article 1 7(2)(a) for the following reasons 
1 . I I Claims Nos. : 

— ' because they relate to subject matter not required to be searched by this Authority, namely 



2. X Claims Nos.: 

because they relate to parts of the international application that do not comply with the prescnbed requirements to such 
an extent that no meaningful international search can be carried out, specifically: 

Observation: It is not possible to assign the expression "pJEVD/M. tuberculosis" to the 
mentioned below inventions since it is not characterized in the present application. 

3. I I ClaimsNos.: 

— because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6 .4(a). 



Box II Observations where unity of invention is lacking (Continuation of item 2 of first sheet) 



This International Searching Authority found multiple inventions in this international application, as follows: 



see annexe 



1 . | | As all required additional search fees were timely paid by the applicant, this international search report covers all 

searchable claims. 

2 . QjJ As all searchable claims could be searched without effort justifying an additional fee, this Authority did not invite payment 

of any additional fee. 

3. As only some of the required additional search fees were timely paid by the applicant, this international search report 
— covers only those claims for which fees were paid, specifically claims Nos. : 



X No required additional search fees were timely paid by the applicant. Consequently, this intemanonal search report is 
— 1 restricted to the invention first mentioned in the claims; it is covered by claims Nos. : 

1-11, 14-19 wholly; 12, 13, 27, 45 partially 

Remark on Protest | ] The additional search fees were accompanied by the applicant's protest 

| | No protest accompanied the payment of additional search fees. 
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1. Claims: 1-11, 14-19 wholly; 12, 13,27, 45 partially 

Recombinant screening, cloning and/or expression vector, as per Claims 1-7, in particular 
pJEVDa, pJVEDb or pJEVDc. 

Recombinant vector as per one of Claims 1 to 7 characterized in that it comprises a 
mycobacterium nucleic acid sequence, as per Claims 8-11. 

Method for screening nucleotide sequences derived from mycobacteria for determining the 
presence of sequences corresponding to exported and/or secreted polypeptides, their 
promoting and/or regulating sequences, characterized in that it uses one of said vectors. 
Genome DNA or mycobacteria cDNA bank, characterized in that it is obtained by the method 
as per Claims 14 and/or 15. 

Recombinant mycobacterium characterized in that it is transformed by a recombinant vector as 
per one of Claims 1-13. 

2. Claims: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 

p6D7 and plB7 vectors, containing the nucleotide sequences Seq.ID:3, 10, and 
mycobacterium transformed by the vector. 

Nucleotide sequences Seq.ID: 3, 10 13 and derived sequences. Complementary, hybridizing or 
fragments of said sequences. Recombinant vectors containing said sequences, host cell 
transformed by said vector. 

Polypeptide, derived or homologous fragments, capable of being coded by said sequences. 
Method for preparing said polypeptide. Derived hybrid polypeptide and corresponding 
polynucleotide. 

Antibodies, their fragments, or chimera antibodies, capable of specifically recognizing said 
polypeptide. 

Diagnostic application of said nucleotide sequences, of said polypeptide, or of said antibodies. 

Therapeutic application of said polypeptide, or said nucleotide sequences. 

Method for screening molecules capable of blocking synthesis or function of said polypeptide. 

Molecules capable of inhibiting the growth of mycobacteria or maintaining mycobacteria in a 

host, characterized in that said molecules are synthesized according to said polypeptide 

structure. 

3. Claims: 12,20-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 

Same as for invention 2 but concerning vector p5A3, 
Seq.ID;4,27 and derived sequences. 

4. Claims: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 

Same as for invention 2 but concerning vector p5F6, 
Seq.ED:5 and derived sequences. 
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5. Claims 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning vector p2A29, 
Seq.ED:6, 20 and derived sequences. 

6. Claims 13, 28, 29, 33, 36, 42, wholly; 12, 20-27, 30-32, 34, 37-41, 43-74 partially 

Same as for invention 2 but concerning vector pDP428, 
Seq.ID: 1,2,25,26,28 and derived sequences. 

7. Claims 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 

Same as for invention 2 but concerning vector p5B5, 
Seq.DD:7, 14 and derived sequences. 

8. Claims: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 

Same as for invention 2 but concerning vectors plC7, p2D7, Seq.ID:8,9,41 and derived 
sequences. 

9. Claim: 12 partially 

Same as for invention 2 but concerning pVED/M tuberculosis. 

10. Claims: 12, 20-27, 30-32, 34, 35, 37-41, 43-74 partially 

Same as for invention 2 but concerning vector pMlC25, 
Seq.ID: 29 and derived sequences. 

11. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID: 1 1. 

12. Claims: 20-22, 24-27, 30-32, 34, 35, 37-42, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID: 12. 

13. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID: 15. 

14. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID: 16 

15. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID: 17 
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16. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:18. 

17. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ED: 19. 

18. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ED:21 

19. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ED:22, 23, 24. 

20. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:3 1 . 

21. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:32. 

22. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44 46-74 partially 
Same as for invention 2 but concerning Seq.BD:33. 

23. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:34. 

24. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:35. 

25. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-71 partially 
Same as for invention 2 but concerning Seq.ID:36. 

26. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 bur concerning Seq.ID:37. 

27. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:38 
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28. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:39. 

29. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:40. 

30. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:42. 

31. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:43. 

32. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.DD:44. 

33. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:45. 

34. Claims: 20-22, 24-27, 30-32, 34, 35 37-41, 43, 44, 46-74 partially 
Same as for invention 2 bur concerning Seq.ID:46. 

35. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:47. 

36. Claims 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.JD:48. 

37. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
same as for invention 2 but concerning seq.ID:49 

38. Claims: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 46-74 partially 
Same as for invention 2 but concerning Seq.ID:50. 
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A. CLASSEMENT DE L'OBJET DE LA DEMANDE 

CIB 6 C12N15/74 C12N15/31 C07K14/35 A61K48/00 A61K39/04 

CG7K19/0O C12Q1/68 CG7K16/12 G01N33/50 G01N33/53 

//C12N15/52.C12N15/65 

Selon la classification intemationale des brevets (CIB) on a la fois salon la classification national et (a CIB 



B. DOMAINES SUR LESQUELS LA RECHERCHE A PORTE 

Documantation minimaie consult** (tysteme d« classification suivi das i/m boles da olassamant] 

CIB 6 C12N C07K A61K C12Q G01N 



Documentation oonsultee autre qua la documantation minimale dans la meaure oir cas documents relevant das domain es sur lesqueta a porta la reoherche 



Basa da don nee* eJeotronique oonsultee au cours da la racharoh* internationale (nom da la baaa da donnees, at ai realisable, ternws da recherohe utiles) 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Catagoria 0 Identification dm documents cits a, aveo, la oas eeheant, r indication des passages pertinartU 



no. des revendioations visees 



WO 96 07745 A 
GICQUEL; LIM; 
14 mars 1996 
voir abrege 
voir page 1 - 
voir page 32 
voir page 45 
voir figures 



(INSTITUT PASTEUR (FR); 
P0RTN0I; BERTHET; TIMM) 



page 13 

- page 37 

- page 52; revendi cations 
1,6,11,12 



1-19,27, 
45 



WO 92 01796 A (SMITHKLINE BEECHAM 
BI0L0GICALS (BE) JACOBS; HAESELEER; 
MASSAER; BOLLEN) 6 fevrier 1992 
voir page 7, ligne 35 - page 8, ligne 21 
voir abrege 
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'A* document definissant Tetat general de la technique, non 

consider* comma partioulierement pertinent 
E* document anterieur, mais publie a la date de depot international 

ou apres cette date 

L* document pouvant jeter un doute sur une revindication de 
priorite ou cite pour determiner la date de publication dune 
autre citation ou pour une raj son specials (telle qu'indiquee) 

O' document se referart a une dkulgation orale, k un usage, a 
une exposition ou tous autre* moyens 

"P" document publie avant la date de depot international, mais 
poeterieure merit a la date de priorite revendiquee 



T dooument utterieur publie apres la date de depot international ou la 
data de priorite et n'appartenenaM pea A l*etat de la 
technique pertinent, mais cite pour oomprendre le princtpe 
ou la theorie constituant la base de r invention 

*X* dooument parti ou liens ment pertinent; I'inven tion revendiquee ne peut 
*tre oon tid eras comma nouveile ou oomme impliquant une aotivite 
inventive par rapport au dooument con side re isolement 

*Y* dooument partioulierement pertinent; i'inven tion revendique* 

ne peut etre considered com me impliquant une aotivite inventive 
lorsque te document est assooie a un ou plusieurs autre* 
documents de meme nature, oette combinaison etant evtdsnte 
pour une person ne du metier 

dooument qui fait parbe de la meme f amide de brevets 



Date a laquelle la recherche intemationale a ete effeotivement aohevee 
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Derr- "1e Internationale No 

PCT/FR 98/01813 



C.( suite) DOCUMENTS CONSIDE RES COMME PERTINENTS 



Categoric • Identification das documents cites, avec,le cas echeant, I' fndi cation des passages pertinents 



no. dea revendioationa viaeea 



ENG MONG LIM ET AL. 



'Identification of 



Mycobacterium tuberculosis DNA sequences 

encoding exported proteins by using phoA 

gene fusions" 

JOURNAL OF BACTERIOLOGY, 

vol. 177, no. 1, 1 janvier 1995, pages 

59-65, XP00055O419 

cite dans la demande 

TIMM J. ET AL.: "Escherichia coli - 
Mycobacteria shuttle vectors for operon 
and gene fusions to lacZ: the pJEM series" 
JOURNAL OF BACTERIOLOGY, 
vol. 175, no. 21, novembre 1994, pages 
6749-6753, XP002063184 

TIMM J. ET AL.: "Transcription and 
expression analysis, using lacZ and phoA 
gene fusions, of Mycobacterium fortuitum 
beta- lactamase genes cloned from a natural 
isolate and a high-level beta-lactamase 
producer" 

MOLECULAR MICROBIOLOGY, 

vol. 12, no. 3, 1994, pages 491-504, 

XP002063436 

cite dans la demande 

SUJOY K. DAS GUPTA ET AL. : "Cloning and 
assessment of Mycobacterial promoters by 
using a plasmid shuttle vector" 
JOURNAL OF BACTERIOLOGY, 
vol. 175, no. 16, aout 1993, pages 
5186-5192, XP002063437 
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T ande intemationale n° 

PCT/FR 98/01813 



Cadre I Observations - lorsqu'il a ete estime que certain es revendications ne pouvaient pas faire I'objet d'une recherche 
(suite du point 1 de la premiere feuille) 



Con forme me nt a I'article 17.2)a), certaines revendications n'ont pas fait I'objet d'une recherche pour les motifs suivants: 



□ 



Les revendications n °* 

se raoportent a un objet a J'egard duquel ('administration n'est pas tenue de proceder a la recherche, a savoir: 



2. X Les revendications n°* 



□ 



se rapportent a des parties de la demande intern ationale qui ne remplissent pas suffisamment les conditions preserves pour 
qu'une recherche significative puisse etre effectuee, en particulier: 

Remarque: L absence de caracteri sation du terme "pJEVD/M. tuberculosis" dans 
la presente demande ne permet pas de l'atribuer a I'une des Inventions 
susdites. 

Les revendications n 03 

sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de la deuxieme et de la 
troisieme phrases de la regie 6.4 a). 



Cadre II Observations - lorsqu'il y a absence d'unite de invention (suite du point 2 de la premiere feuille) 



L'administration chargee de la recherche intern ationale a trouve ptusieurs inventions dans la demande internationals, a savoir: 

voir feuille supplementaire 

1 • I I Comme toutes les taxes addition nelles ont ete payees dans les delais par le deposant, le present rapport de recherche 
1 1 intern ationale porte sur toutes les revendications pouvant faire Pobjet d'une recherche. 

2. 1 1 Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu etre effectuees sans effort particulier 

justifiant una taxe additionnelle, ('administration n'a sollicite le paiement d'aucune taxe de cette nature. 

3. Comme una partie seulement des taxes additionnelles demandees a ete payee dans les delais par le deposant, fe present 
1 1 rapport de recherche intern at ion ale ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 

les revendications n °* 



X Aucune taxe additionnelle demandee n'a ete payee dans les delais par lg deposant. En consequence, le present rapport 

1 de recherche Internationale ne porte que sur I'invention mentionnee en premier lieu dans les revendications; elle est 

couverte par les revendications n °* 

1-11,14-19 complfctement; 12,13,27,45 partiel lement 



Remarque quant a la reserve | | Les taxes additionnelles etaient accompagn^es d une reserve de la part du deposam 

| [ Le paiement des taxes additionnelles n'etait aasorti d'aucune reserve. 
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SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



1. revendications: 1-11, 14-19 completement; 12, 13, 27, 
45 parti el lement 



Vecteur recombinant de criblage, de clonage et/ou 
d' expression, conformement aux revendications 1-7, notanment 
pJEVDa, pJEVDb ou pJEVDc. 

Vecteur recombinant selon 1'une des revendications 1 a 7, 
caracterise en ce qu'il comprend une sequence d'acide 
nuclei que de mycobacterie, conformement aux revendications 
8-11. 

Procede de criblage de sequences de nucleotides issues de 
mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes, 
leurs sequences promotrices et/ou regulatrices, caracterise 
en ce qu'il met en oeuvre un des vecteurs precites. 

Banque d'ADN genomique ou d'ADNc de mycobacteries, 
caracterisee en ce qu'elle est obtenue par un procede selon 
la revendi cation 14 et/ou 15. 

Mycobacterie recombinante caracterisee en ce qu'elle est 
transformee par un vecteur recombinant selon Tune des 
revendications 1 a 13. 



2. revendications: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 
46-74 parti el lement 

Vecteurs p6D7 et plB7, contenant les sequences 
nucleotidiques Seq. 10:3,10, et mycobacterie transformee par 
le vecteur. 

Sequences nucleotidiques Seq. ID:3,10,13 et sequences 
derivees. Polynucleotides corrplementaires, hybridants ou 
fragments de les sequences precitees. Vecteur recombinant 
contenant les sequences precitees, cellule hote transformee 
par ledit vecteur. 

Polypeptide, fragments derives ou homologues, 
susceptibles d'etre codes par les sequences precitees. 
Procede de preparation dudit polypeptide. Polypeptide 
hybride derive et polynucleotide correspondant. 

Anticorps, leurs fragments, ou anticorps chimeriques, 
capables de reconnaitre specif iquement ledit polypeptide. 

Application en diagnostique de les sequences 
nucleotidiques precitees, dudit polypeptide, ou desdits 
anticorps. 

Application en therapie dudit polypeptide, ou de les 
sequences nucleotidiques precitee. 

Methode de criblage de molecules capables de bloquer la 
synthese ou la fonction dudit polypeptide. Molecules 
capables d'inhiber la croissance de mycobacteries ou le 
maintien de mycobacteries dans un hote, caracterisees en ce 
que lesdites molecules sont synthetisees d'apres la 
structure dudit polypeptide. 
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3. revendi cations: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 
46-74 partiellement 



Conine 1 'invention 2 mais concernant le vecteur p5A3, 
Seq.ID:4,27 et sequences derivees. 



4. revendications: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 
46-74 partiel lement 



Conme I'invention 2 mais concernant le vecteur p5F6, 
Seq.ID:5 et sequences derivees. 



5. revendications: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 
46-74 partiellement 



Conme I'invention 2 mais concernant le vecteur p2A29, 
Seq.ID:6,20 et sequences derivees. 



6. revendications: 13, 28, 29, 33, 36, 42 completement; 12, 20-27, 
30-32, 34, 35, 37-41, 43-74 partiellement 



Conine I'invention 2 mais concernant le vecteur pDP428, 
Seq.ID:l,2,25,26,28 et sequences derivees. 



7. revendications: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 
46-74 partiellement 



Conine I'invention 2 mais concernant le vecteur p5B5, 
Seq.ID:7,14 et sequences derivees. 



8. revendications: 12, 20-27, 30-32, 34, 35, 37-41, 43, 44, 
46-74 partiellement 



Conme I'invention 2 mais concernant les vecteurs plC7, 
p2D7, Seq. ID:8,9,41 et sequences derivees. 



9. revendication : 12 partiellement 

Conme I'invention 2 mais concernant pJVED/M. tuberculosis. 



10. revendications: 12, 20-27, 30-32, 34, 35, 37-41, 
43-74 partiellement 
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SUITE DES RENSE1GNEMENTS INDIQUES SUR PCT/ISA/ 210 

Comme Tinvention 2 mais concernant le vecteur pMlC25, 
Seq.ID:29 et sequences derivees. 

11. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 parti el lement 

Comne Tinvention 2 mais concernant Seq.ID:ll. 

12. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 parti el lement 

Conine Tinvention 2 mais concernant Seq.ID:12. 

13. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 parti el lement 

Comne Tinvention 2 mais concernant Seq.ID:15. 

14. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Comne Tinvention 2 mais concernant Seq.ID:16. 

15. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Comne Tinvention 2 mais concernant Seq.ID:17. 

16. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 parti el lement 

Comme Tinvention 2 mais concernant Seq.ID:18. 

17. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Comne Tinvention 2 mais concernant Seq.ID:19. 
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18. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Comme T invention 2 mais concernant Seq.ID:21. 

19. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Comme 1' invention 2 mais concernant Seq. ID:22,23,24. 

20. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Conine 1' invent ion 2 mais concernant Seq. ID: 31. 

21. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Comme l'invention 2 mais concernant Seq.ID:32. 

22. revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 parti el lement 

Comme l'invention 2 mais concernant Seq.ID:33. 

23. revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 parti el lement 

Conine l'invention 2 mais concernant Seq.ID:34. 

24. revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 parti el lement 

Comne l'invention 2 mais concernant Seq.ID:35. 

25. revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 44, 

46-74 partiel lement 

Comne l'invention 2 mais concernant Seq.ID:36. 
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26. 


revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 








LOnine i invention d mais concernant jeq.iu.^/. 






27. 


revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 








LOnme i invention c mais concernant beq.iLKoo. 






28. 


revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 








Conine 1 'invention 2 mais concernant Seq.ID:39 






29. 


revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 








Connie 1' invention 2 mais concernant Seq.ID:40 






30. 


revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 








Comme 1 'invention 2 mais concernant Seq.ID:42 






31. 


revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 






- 


lOirme i invention c mais concernant beq.iu:4j 






32. 


revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 








Comme 1' invention 2 mais concernant Seq.ID:44 






33. 


revendications: 20-22, 24-27, 30-32, 34, 35, 37-41, 


43, 


44, 




46-74 partiellement 








Comme 1 'invention 2 mais concernant Seq.ID:45 
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34. 


revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 
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Connie 1 'invention 2 mais concernant Seq.ID:46. 




35. 


revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 


44, 




46-74 parti el lement 






Comme 1' invention 2 mais concernant Seq.ID:47. 




36. 


revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 


44, 




46-74 parti el lement 






Comme 1' invention 2 mais concernant Seq.ID:48. 




37. 


revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 


44, 




46-74 parti el lement 






Comme 1' invent ion 2 mais concernant Seq.ID:49. 




38. 


revendi cations: 20-22, 24-27, 30-32, 34, 35, 37-41, 43, 


44, 




46-74 parti el lement 






Comme 1' invention 2 mais concernant Seq.ID:50. 
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